硅谷考察解读 · 2026.04

全员 token-maxxing
一场没人敢停的军备竞赛

五源资本孟醒在硅谷待了半个月,回来只写下三个字:跟不上。YC 跟不上、Meta 的代码安全跟不上、xAI 的管理跟不上、估值框架跟不上、社会的心理承受力也跟不上——硅谷自己都开始跟不上自己了。

原文作者 孟醒(五源资本合伙人 / 前滴滴自动驾驶 COO) 发布平台 晚点 LatePost 专栏 解读 Wayne · wwei.ai

目录

  1. YC 变成滞后指标
  2. 全员 token-maxxing
  3. xAI 雪崩
  4. 工程师与 researcher 的焦虑
  5. 英伟达的双估值游戏
  6. 估值体系正在重写
  7. 酸橙树与 AI 暗杀名单
  8. Wayne 的复盘

三句话读懂

① 半年前不可想象的事情现在天天发生:Meta 几万工程师全员用对手的 Claude Code 写代码、代码安全红线被推翻,只为冲速度。

② "效率涨了 100 倍"是真的,"营收涨了 100 倍"是没影的——蒸汽机已经造出来,但跑得还没马车快,可没人敢停下来等它跑赢。

③ 真正的中心是英伟达,估值框架在崩塌,硅谷大佬开始在家门口种酸橙树挡刺客。

01

YC 从领先指标变成滞后指标

5 个月前选出的"好公司",今天可能一个周末就能被复刻。

2026 年 3 月 24 日,YC W26 batch Demo Day。孟醒听到第五家公司路演时,决定不再做笔记——"自己记下来的这些东西,可能下个月就过时了"。

这一届 100+ 公司里,约 80% 都是垂直 agent:帮律师整理文件、帮客服分发工单、帮 HR 筛简历。

核心判断:Claude Code 把 vibe coding 门槛压到地板,"今天一个普通工程师,甚至我自己,花一个周末就能做出来"——这些垂直 agent 在没形成业务壁垒之前,已经失去了投资价值

YC 一届周期 3 个月 + 前期筛选 = 5 个月前的快照。而 5 个月在今天的 AI 迭代速度里,足够发生几轮范式转换。运转了十几年非常成功的 batch 制度,是按一个更慢的世界设计的。

"硅谷自己都开始跟不上自己了。" — 一位做 post-training 的朋友,晚饭随口一说
02

全员 token-maxxing:没人敢停的军备竞赛

三道红线接连倒下:代码安全、token 预算、人头编制。

半年前如果有人说 Meta 几万名工程师全在用竞争对手的产品写代码,孟醒会以为是开玩笑。但这是真的——整个 Meta,全员都在用 Claude Code

第一面倒下的旗:代码安全

代码是公司核心资产,让外面公司的 API 来碰它,过去不可想象。Meta 内部做过一个叫 myclaw 的工具试图自研,结果"不好用,没人用"。最后只能放宽:只要不涉及客户数据,爱用 Claude Code 就用。

Google 出于安全禁用对手工具,但 DeepMind 例外——负责 Gemini 模型和内部应用的几个团队都在用 Claude Code。Anthropic 给 DeepMind 做了私有化部署(毕竟 Anthropic 推理训练大头跑在 Google TPU 上),但 Meta 没这层关系,是真的把代码安全扔到了一边。

第二面倒下的旗:token 预算

$200K+
Palo Alto AI-native 创业公司,单工程师年度 token 预算
≈ 1×
顶级工程师 AI 成本 / 工资比
10+
一家 C 轮公司技术负责人后台并行的 Cursor agent 数

Meta 搞了内部 token 消耗排行榜:用得多的上榜,末尾可能被裁,员工卷一个非官方头衔叫 "token legend"。同期 Meta 接连两轮裁员上万人——一边全员烧 token、一边大规模裁人,这两件事不是矛盾的,是一件事的两面。

最尴尬的真相:效率涨了,营收没涨

从去年底开始,很多 CTO 兴奋地讲"百倍工程师""十倍效率提升"——以前 60 人 1 年的事,现在 2 人 + Claude Code 一周搞完。

"好,效率提升了 100 倍,那公司的营收增长了 100 倍吗?或者产品线扩张了 100 倍?总不能 100 倍的提升,最后就是优化掉多少人吧?" — 孟醒

事实是 100 倍效率,落到营收上只体现了 50% 或 1 倍。差距在哪?现在没人能说清楚。

"用了这么多 token,公司应该基因突变成另外一种公司才对。但到底变成什么,我也不知道。"

反例来自 Anthropic 内部:连他们自己最痛的场景都是 oncall 不好用——全世界最强的 coding agent 公司,做不好离自己核心能力最近的事。

2026 年 4 月真实状态:蒸汽机已经被发明了出来,但它有时候跑得还没有马车快。关键是所有人都知道蒸汽机终将跑得更快,所以都在疯狂砸钱。
停下来的代价,可能比烧错 token 更大。

METR 指标:拐点临近

METR 的指标 — AI agent 能以 50% 成功率完成多长的任务(按人类专家完成时间算):

类似 2021 年自动驾驶在上海首次实现 5 小时无接管的拐点——之前测试车 10、15、20 台慢慢加,过了拐点就直接到 100、1000 台。一旦 agent 可靠性再上一个台阶,token 消耗不是每年加 50%,而是一夜之间上一个数量级

"到今年年底,不少公司(包括科技大厂),实际上只需要 20% 的人。" — 朋友圈里一个获得共识的预测
03

xAI 雪崩:造火箭的人开始造模型了

早期团队走了 90%,一个内部细节足以说明一切:在公司睡了三年 sleeping pod 的人,家里至今没买床。

导火索是 Tony Wu 被开掉,连锁反应——"别的公司可能需要酝酿半年的高管团队出走,xAI 只需要一个月"。马斯克现在从 SpaceX 和特斯拉调人接管 xAI。

每个 xAI 出来的人都被孟醒问同一个问题:砸了无数资金和算力,Grok 为什么没进一线?答案出奇地简单——制造业的管理方式,可能不适合大模型公司。

系统工程 vs 大模型创新

SpaceX、特斯拉本质是系统工程:链路长,软硬件供应链每块有创新空间,但最终是端到端工程问题。马斯克擅长在长链条里识别关键杠杆,极限压缩时间线攻克。

但 xAI 他做了三件事:

这是抓几个点,不是做完整规划。AI 三方向(软件 / infra / 硬件)都需要 CTO 级决策但没人全懂——好的做法是创始人虽不全懂但能平衡资源、定阶段优先级。xAI 没有全局规划,只有冲刺。压力一大就散了,每个负责人都在保自己的优先级。

SpaceX 和特斯拉之所以如此成功,一个被忽略的原因是,在这两个行业里,马斯克基本没有遇到过同等量级的竞争对手——他是跟自己卷的。
但 AI 不一样,AI 是连 OpenAI 都可能被 Anthropic 偷家的惨烈竞争程度。

但离开 xAI 的人也不会后悔——xAI 是硅谷最快的造富神话:从首轮几十亿美金融资到与 SpaceX 合并成 2500 亿美元巨兽,只用了一年。9 位 cofounder 几乎人人成 Billionaire,核心工程师大几千万到 1 亿美金。

04

焦虑的工程师,更焦虑的 researcher

"我们都在人肉蒸馏自己。"

跟工程师聊天有种奇怪的默契:大家都承认不怎么写代码了,但又都假装这没什么大不了——因为自己会成为被 AI 武装、干掉那些没 AI 化的工程师的人。

今天 80% 软件工程师的核心技能已被模型替代,留着只是因为模型偶尔犯蠢需要人盯着。但"盯着"这件事本身可能很快也不需要了。

所谓"AI native 组织"听起来很 sexy——让每个部门梳理工作流、把能被 AI 介入的部分线上化、写成 skills。本质上就是在人肉蒸馏自己:你把你的能力变成机器的 skill,公司拿到了你的 skill,实际上就已经完成 AI 化了。

Researcher 也在被替代

Researcher 是金字塔尖人才——大模型公司里负责模型训练、算法创新的那群人。Engineer 是"造出来",researcher 是更上游的"想出来造什么"。

而现在 DeepMind 在做的事情:用模型去训模型,今年硅谷大火的 AI 自进化。今年淘汰的是 engineer,到年底 researcher 也将开始被替代。

Karpathy 的 auto research 开了头,目前大多数闭环只到"发 paper"。OpenAI、Anthropic、Google 想做的更激进:闭环直接到模型升级本身——让 AI 自己找到下一个范式级突破。

而且 researcher 更有动机被裁,原因很残酷——因为贵。全球可能就几千人,年薪动辄几百万、上千万甚至上亿美元。

"未来的情形可能是,10 个人干过去 100 个人的活,拿 20 份钱,然后 90 个人失业。"

而且真正的裁员比表面数字大。很多公司砍的第一刀不在自己财报上,砍的是外包服务商——意味着印度、菲律宾这些承接欧美客服、数据标注、财务后台的国家最先被冲击。一些发展中国家赖以升级经济的"服务业阶梯",可能正被 AI 抽掉。

新岗位:AI builder

裁掉旧岗位的同时,创业公司开始招一种叫 AI builder 的新角色:合并了 PM + 前端 + 后端于一身。还有合并数据科学家+ML 工程师的,以及合并写作+投放+运营的内容一体化操盘手。

核心难题是没人知道怎么招聘他们——简历筛不出来(角色以前不存在),现场写代码也考不出来(核心是"审美 + AI 使用能力")。已经有创业公司根据雇主需求自动生成模拟环境,让面试者现场用 AI 工具完成任务。

当 AI 什么都能做的时候,人的价值正在从"会做什么",变成判断"什么值得做、什么不该做"。
05

英伟达:每张牌桌上都要拿筹码

这个看似分布式创新的世界,底层其实在极度中心化。

原以为卡的稀缺性已经缓解了,但孟醒发现:稀缺性又回去了,而且比上次更离谱。

具体信号:如果你今天能稳定提供 Claude API 这类服务,做到 99 分位稳定性,可以卖官方价的 2-3 倍。Anthropic 需求暴增后 API 中断变多,对很多构建在 Claude 之上的 Agent 产品是个问题。
以前做 Router 是"我比官方便宜所以有流量",现在逻辑反过来:稳定性本身变成稀缺资源

而且这次算力瓶颈不只是 GPU 分配——上游内存厂商(Hynix、Samsung、Micron)的产能扩建周期至少还要两年。意味着 2028 年之前没有任何 AI 公司能靠堆算力拉开差距。算力约束客观上在强化大模型市场的寡头格局。

Reflection 案例:黄仁勋亲手转向

Reflection 最早出来融资是做 coding 的。创始人去见黄仁勋,黄说:"你别搞 coding 了,你出来给我做美国的 DeepSeek,做美国的开源模型,我给你钱给你卡。" Reflection 180 度转型。

一轮融资两个估值

美国资本市场出现以前少见的结构:同一轮融资,两个估值档位。关系好、进场早的进低估值;英伟达和晚到的投资人被挤到高估值那一档。这种结构最近在国内也开始出现。

但英伟达再想控制分配,也搞不定不存在的东西。全美约 100 个数据中心项目正在遭遇阻击,其中 40 个会直接流产。缅因州刚通过法案全面禁止数据中心建设。一个城镇批了 60 亿美元数据中心项目,结果半数议员连夜被罢免,新议员唯一目的就是撤销那个决定。

算力不够了,不是因为产品不够好、用户不够多,是因为物理世界跟不上数字世界的胃口

06

硅谷估值体系正在重写

DCF 最基本的两个假设——可预测的现金流、稳定的终值——都崩了。

$30T
美国 GDP
$30B
OpenAI / Anthropic 各自年化收入
0.1%
两家 AI 公司各自占美国 GDP 比例
~1%
年底 AI 整体预计占美 GDP(含云)

从几乎为零到 1%,只用了短短几年。但增长越快,投资人反而越不知道该怎么定价了。一个反复出现的词是 re-rationalization(估值的理性回归)

DCF 失灵的两条线

"今天不在 AI 主航道上的公司,更像是在等一颗'核弹',你知道它一定会被颠覆,只是不知道什么时候。
那你评估的重点,就不应该是'如果不被颠覆会怎样',而应该是'被颠覆时,应对的速度有多快'。"

SaaS 是第一个被华尔街重新定价的:Snowflake 2023 年按自由现金流算要近 100 年回本,如今估值已腰斩,ServiceNow、Workday 同样趋势——这只是开始

反过来,真正适合用 DCF 估值的,可能只剩头部大模型公司——他们不会"被炸",而是在看边界能拓多宽。

ARR 倍数分层

过去大家觉得 1 块钱 ARR 就是 1 块钱 ARR,今天这个等号被打破了:

垂直 agent ARR 倍数
10×
通用 agent ARR 倍数
20-30×
模型公司 ARR 倍数(Anthropic:30B ARR / 800B 估值 = 26.7×)
"反正要么 zero to 100,要么 zero to zero,与其投一个贵的 A 轮赚'辛苦钱',不如赌一个有无限可能的 neo lab 的入场券。" — 一位 VC 朋友

员工层面同样的逻辑反转:过去说"工资低一点,给你期权,未来值大钱",前提是公司 15-20 年后还在还值钱。如果前提不成立,员工最理性的反应是——"别给我期权了,直接涨现金。"

07

酸橙树与 AI 暗杀名单

硅谷正在经历一场深层的安全感危机。买比特币、建地堡、装防弹玻璃——他们不是开玩笑的语气。

最近硅谷流行种酸橙树——这种树枝条上长着 4 英寸尖刺,任何试图翻越的人都会付出代价。

华尔街日报报道一栋 1500 万美元的"堡垒豪宅":混凝土花盆栽一圈酸橙树,树丛后面是壕沟,壕沟后是激光入侵探测系统,前门 3 英寸厚实心钢板配 13 道锁栓,屋内藏着 2000 磅重门的安全避难室,连景观设计都是防御工事。

为 CEO 提供住宅安防的企业,创下 2003 年以来最高增长。UNH CEO 在曼哈顿街头遭枪击身亡之后,趋势陡然加速。

枪声响到了 AI 大佬家门口

据说马斯克也非常担心被枪杀,圈子里是公开的秘密。

背后的恐惧很朴素:如果 AI 接管了大部分生产,人不再是经济运转的必要参与者,那过去所有"你贡献了多少、你该分多少"的社会契约就全失效了。剩下的只有一个极简的权力结构:谁控制了 GPU 和电力,谁就控制了一切。阶层不是被拉开了,是被压扁了——一边是极少数人,另一边是所有其他人。
"两年之后的美国大选,最火的竞选主题,肯定是 AI 与社会的关系问题。甚至会出现 AI 时代的卢德运动。"
08

尾声 + Wayne 的复盘

在写满"跟不上"的笔记本最后,孟醒留下了一个让人意外的乐观注脚。

Anthropic 的 Dario Amodei 在内部说过一句话:在 AI 的帮助下,癌症在某种意义上已经被攻克了——不是消失了,而是它有可能变成一种不会死人的慢性病,只是治疗费用还太贵,普及需要时间。

这次硅谷之行,孟醒看得最多的创业方向是 AI4S、AI for Biotech,很多大模型公司出来的人不懂医疗,但他们想用 AI 改变这个行业。

这半个月我看到了那么多"跟不上",这确实让人焦虑。但如果 AI 真的在几年内让癌症变成慢性病、让材料科学快进二十年,那么这一场"跟不上",可能是人类发展历史上最大的一次提速

"我家宝宝今年两岁,明年可能会有第二个孩子,他们这一代要面对的那个世界什么样,我现在完全没有想象力去构建。但我希望,在他们长大的世界里,多一些因 AI 而被治愈的人,而不是有更多燃烧瓶和枪声,砸向 AI 从业者的家门口。"

Wayne 视角 · 这篇对千图意味着什么

  1. 垂直 agent 投资价值塌方 = 中国 AI 应用层窗口期同样在收紧。千图做 AI 设计工具,必须比对手更靠近"无法被一个周末复刻"的护城河——独家素材、设计师生态、品牌信任、企业级闭环,这些是模型替代不掉的。
  2. "100 倍效率不等于 100 倍营收"是个救命警钟。AI 在我们内部用得越凶,越要逼自己问:省下来的人/钱去了哪里,是变成新业务还是只是缩了支出?答案不该只是裁员。
  3. "能力被蒸馏成 skill = AI 化完成"——千图自己写 skills 时要小心。把工作流写明白是好事,但同时要想清楚:哪些是平台沉淀(壁垒),哪些是个人手艺(要保护)。
  4. 稳定性变成稀缺资源,是中国服务商的机会。Claude API 都能卖 2-3 倍价,意味着"国内稳定可用的高质量 AI 接入"对中国 B 端是真需求——这块千图未必自己做,但要看懂客户为什么愿意付溢价。
  5. 估值框架重写 = 创业公司谈融资的话术要变。不再是"未来 5 年 ARR 复合增长 X%",而是"被颠覆时我们的应对速度多快"——这是一个完全不同的故事结构。
  6. METR 翻倍周期从 7 个月→4 个月。盯紧这个数。一旦 agent 可靠性突破下个拐点,所有"agent 还不够好用"的判断都会在三个月内失效。