全员 token-maxxing — 解读孟醒硅谷考察笔记

YC 从领先指标变成滞后指标

5 个月前选出的"好公司"，今天可能一个周末就能被复刻。

2026 年 3 月 24 日，YC W26 batch Demo Day。孟醒听到第五家公司路演时，决定不再做笔记——"自己记下来的这些东西，可能下个月就过时了"。

这一届 100+ 公司里，约 80% 都是垂直 agent：帮律师整理文件、帮客服分发工单、帮 HR 筛简历。

核心判断：Claude Code 把 vibe coding 门槛压到地板，"今天一个普通工程师，甚至我自己，花一个周末就能做出来"——这些垂直 agent 在没形成业务壁垒之前，已经失去了投资价值。

YC 一届周期 3 个月 + 前期筛选 = 5 个月前的快照。而 5 个月在今天的 AI 迭代速度里，足够发生几轮范式转换。运转了十几年非常成功的 batch 制度，是按一个更慢的世界设计的。

"硅谷自己都开始跟不上自己了。" — 一位做 post-training 的朋友，晚饭随口一说

全员 token-maxxing：没人敢停的军备竞赛

三道红线接连倒下：代码安全、token 预算、人头编制。

半年前如果有人说 Meta 几万名工程师全在用竞争对手的产品写代码，孟醒会以为是开玩笑。但这是真的——整个 Meta，全员都在用 Claude Code。

第一面倒下的旗：代码安全

代码是公司核心资产，让外面公司的 API 来碰它，过去不可想象。Meta 内部做过一个叫 myclaw 的工具试图自研，结果"不好用，没人用"。最后只能放宽：只要不涉及客户数据，爱用 Claude Code 就用。

Google 出于安全禁用对手工具，但 DeepMind 例外——负责 Gemini 模型和内部应用的几个团队都在用 Claude Code。Anthropic 给 DeepMind 做了私有化部署（毕竟 Anthropic 推理训练大头跑在 Google TPU 上），但 Meta 没这层关系，是真的把代码安全扔到了一边。

第二面倒下的旗：token 预算

$200K+

Palo Alto AI-native 创业公司，单工程师年度 token 预算

≈ 1×

顶级工程师 AI 成本 / 工资比

10+

一家 C 轮公司技术负责人后台并行的 Cursor agent 数

Meta 搞了内部 token 消耗排行榜：用得多的上榜，末尾可能被裁，员工卷一个非官方头衔叫 "token legend"。同期 Meta 接连两轮裁员上万人——一边全员烧 token、一边大规模裁人，这两件事不是矛盾的，是一件事的两面。

最尴尬的真相：效率涨了，营收没涨

从去年底开始，很多 CTO 兴奋地讲"百倍工程师""十倍效率提升"——以前 60 人 1 年的事，现在 2 人 + Claude Code 一周搞完。

"好，效率提升了 100 倍，那公司的营收增长了 100 倍吗？或者产品线扩张了 100 倍？总不能 100 倍的提升，最后就是优化掉多少人吧？" — 孟醒

事实是 100 倍效率，落到营收上只体现了 50% 或 1 倍。差距在哪？现在没人能说清楚。

"用了这么多 token，公司应该基因突变成另外一种公司才对。但到底变成什么，我也不知道。"

反例来自 Anthropic 内部：连他们自己最痛的场景都是 oncall 不好用——全世界最强的 coding agent 公司，做不好离自己核心能力最近的事。

2026 年 4 月真实状态：蒸汽机已经被发明了出来，但它有时候跑得还没有马车快。关键是所有人都知道蒸汽机终将跑得更快，所以都在疯狂砸钱。
停下来的代价，可能比烧错 token 更大。

METR 指标：拐点临近

METR 的指标 — AI agent 能以 50% 成功率完成多长的任务（按人类专家完成时间算）：

2025 年 3 月，Claude 3.7 Sonnet：50 分钟
2025 年底，Claude Opus 4.6：14.5 小时
翻倍周期：从 7 个月压缩到 4 个月

类似 2021 年自动驾驶在上海首次实现 5 小时无接管的拐点——之前测试车 10、15、20 台慢慢加，过了拐点就直接到 100、1000 台。一旦 agent 可靠性再上一个台阶，token 消耗不是每年加 50%，而是一夜之间上一个数量级。

"到今年年底，不少公司（包括科技大厂），实际上只需要 20% 的人。" — 朋友圈里一个获得共识的预测

xAI 雪崩：造火箭的人开始造模型了

早期团队走了 90%，一个内部细节足以说明一切：在公司睡了三年 sleeping pod 的人，家里至今没买床。

导火索是 Tony Wu 被开掉，连锁反应——"别的公司可能需要酝酿半年的高管团队出走，xAI 只需要一个月"。马斯克现在从 SpaceX 和特斯拉调人接管 xAI。

每个 xAI 出来的人都被孟醒问同一个问题：砸了无数资金和算力，Grok 为什么没进一线？答案出奇地简单——制造业的管理方式，可能不适合大模型公司。

系统工程 vs 大模型创新

SpaceX、特斯拉本质是系统工程：链路长，软硬件供应链每块有创新空间，但最终是端到端工程问题。马斯克擅长在长链条里识别关键杠杆，极限压缩时间线攻克。

但 xAI 他做了三件事：

砸全球最大 GPU 集群（"xAI 本来是 neo lab，现在更像 neo cloud，给 Cursor 提供算力"）
给团队定脉冲式 deadline
亲自拍一些产品特征

这是抓几个点，不是做完整规划。AI 三方向（软件 / infra / 硬件）都需要 CTO 级决策但没人全懂——好的做法是创始人虽不全懂但能平衡资源、定阶段优先级。xAI 没有全局规划，只有冲刺。压力一大就散了，每个负责人都在保自己的优先级。

SpaceX 和特斯拉之所以如此成功，一个被忽略的原因是，在这两个行业里，马斯克基本没有遇到过同等量级的竞争对手——他是跟自己卷的。
但 AI 不一样，AI 是连 OpenAI 都可能被 Anthropic 偷家的惨烈竞争程度。

但离开 xAI 的人也不会后悔——xAI 是硅谷最快的造富神话：从首轮几十亿美金融资到与 SpaceX 合并成 2500 亿美元巨兽，只用了一年。9 位 cofounder 几乎人人成 Billionaire，核心工程师大几千万到 1 亿美金。

焦虑的工程师，更焦虑的 researcher

"我们都在人肉蒸馏自己。"

跟工程师聊天有种奇怪的默契：大家都承认不怎么写代码了，但又都假装这没什么大不了——因为自己会成为被 AI 武装、干掉那些没 AI 化的工程师的人。

今天 80% 软件工程师的核心技能已被模型替代，留着只是因为模型偶尔犯蠢需要人盯着。但"盯着"这件事本身可能很快也不需要了。

所谓"AI native 组织"听起来很 sexy——让每个部门梳理工作流、把能被 AI 介入的部分线上化、写成 skills。本质上就是在人肉蒸馏自己：你把你的能力变成机器的 skill，公司拿到了你的 skill，实际上就已经完成 AI 化了。

Researcher 也在被替代

Researcher 是金字塔尖人才——大模型公司里负责模型训练、算法创新的那群人。Engineer 是"造出来"，researcher 是更上游的"想出来造什么"。

而现在 DeepMind 在做的事情：用模型去训模型，今年硅谷大火的 AI 自进化。今年淘汰的是 engineer，到年底 researcher 也将开始被替代。

Karpathy 的 auto research 开了头，目前大多数闭环只到"发 paper"。OpenAI、Anthropic、Google 想做的更激进：闭环直接到模型升级本身——让 AI 自己找到下一个范式级突破。

而且 researcher 更有动机被裁，原因很残酷——因为贵。全球可能就几千人，年薪动辄几百万、上千万甚至上亿美元。

"未来的情形可能是，10 个人干过去 100 个人的活，拿 20 份钱，然后 90 个人失业。"

而且真正的裁员比表面数字大。很多公司砍的第一刀不在自己财报上，砍的是外包服务商——意味着印度、菲律宾这些承接欧美客服、数据标注、财务后台的国家最先被冲击。一些发展中国家赖以升级经济的"服务业阶梯"，可能正被 AI 抽掉。

新岗位：AI builder

裁掉旧岗位的同时，创业公司开始招一种叫 AI builder 的新角色：合并了 PM + 前端 + 后端于一身。还有合并数据科学家+ML 工程师的，以及合并写作+投放+运营的内容一体化操盘手。

核心难题是没人知道怎么招聘他们——简历筛不出来（角色以前不存在），现场写代码也考不出来（核心是"审美 + AI 使用能力"）。已经有创业公司根据雇主需求自动生成模拟环境，让面试者现场用 AI 工具完成任务。

当 AI 什么都能做的时候，人的价值正在从"会做什么"，变成判断"什么值得做、什么不该做"。

英伟达：每张牌桌上都要拿筹码

这个看似分布式创新的世界，底层其实在极度中心化。

原以为卡的稀缺性已经缓解了，但孟醒发现：稀缺性又回去了，而且比上次更离谱。

具体信号：如果你今天能稳定提供 Claude API 这类服务，做到 99 分位稳定性，可以卖官方价的 2-3 倍。Anthropic 需求暴增后 API 中断变多，对很多构建在 Claude 之上的 Agent 产品是个问题。
以前做 Router 是"我比官方便宜所以有流量"，现在逻辑反过来：稳定性本身变成稀缺资源。

而且这次算力瓶颈不只是 GPU 分配——上游内存厂商（Hynix、Samsung、Micron）的产能扩建周期至少还要两年。意味着 2028 年之前没有任何 AI 公司能靠堆算力拉开差距。算力约束客观上在强化大模型市场的寡头格局。

Reflection 案例：黄仁勋亲手转向

Reflection 最早出来融资是做 coding 的。创始人去见黄仁勋，黄说："你别搞 coding 了，你出来给我做美国的 DeepSeek，做美国的开源模型，我给你钱给你卡。" Reflection 180 度转型。

一轮融资两个估值

美国资本市场出现以前少见的结构：同一轮融资，两个估值档位。关系好、进场早的进低估值；英伟达和晚到的投资人被挤到高估值那一档。这种结构最近在国内也开始出现。

但英伟达再想控制分配，也搞不定不存在的东西。全美约 100 个数据中心项目正在遭遇阻击，其中 40 个会直接流产。缅因州刚通过法案全面禁止数据中心建设。一个城镇批了 60 亿美元数据中心项目，结果半数议员连夜被罢免，新议员唯一目的就是撤销那个决定。

算力不够了，不是因为产品不够好、用户不够多，是因为物理世界跟不上数字世界的胃口。

硅谷估值体系正在重写

DCF 最基本的两个假设——可预测的现金流、稳定的终值——都崩了。

$30T

美国 GDP

$30B

OpenAI / Anthropic 各自年化收入

0.1%

两家 AI 公司各自占美国 GDP 比例

~1%

年底 AI 整体预计占美 GDP（含云）

从几乎为零到 1%，只用了短短几年。但增长越快，投资人反而越不知道该怎么定价了。一个反复出现的词是 re-rationalization（估值的理性回归）。

DCF 失灵的两条线

过去预测 10 年现金流，现在只能预测 3 年（甚至 1 年）——之后行业变成什么样根本看不清
Terminal value（占整个估值 70-80%）的前提是"稳定经营"，但 AI 随时可能颠覆一切，这个假设不成立

"今天不在 AI 主航道上的公司，更像是在等一颗'核弹'，你知道它一定会被颠覆，只是不知道什么时候。
那你评估的重点，就不应该是'如果不被颠覆会怎样'，而应该是'被颠覆时，应对的速度有多快'。"

SaaS 是第一个被华尔街重新定价的：Snowflake 2023 年按自由现金流算要近 100 年回本，如今估值已腰斩，ServiceNow、Workday 同样趋势——这只是开始。

反过来，真正适合用 DCF 估值的，可能只剩头部大模型公司——他们不会"被炸"，而是在看边界能拓多宽。

ARR 倍数分层

过去大家觉得 1 块钱 ARR 就是 1 块钱 ARR，今天这个等号被打破了：

5×

垂直 agent ARR 倍数

10×

通用 agent ARR 倍数

20-30×

模型公司 ARR 倍数（Anthropic：30B ARR / 800B 估值 = 26.7×）

"反正要么 zero to 100，要么 zero to zero，与其投一个贵的 A 轮赚'辛苦钱'，不如赌一个有无限可能的 neo lab 的入场券。" — 一位 VC 朋友

员工层面同样的逻辑反转：过去说"工资低一点，给你期权，未来值大钱"，前提是公司 15-20 年后还在还值钱。如果前提不成立，员工最理性的反应是——"别给我期权了，直接涨现金。"

酸橙树与 AI 暗杀名单

硅谷正在经历一场深层的安全感危机。买比特币、建地堡、装防弹玻璃——他们不是开玩笑的语气。

最近硅谷流行种酸橙树——这种树枝条上长着 4 英寸尖刺，任何试图翻越的人都会付出代价。

华尔街日报报道一栋 1500 万美元的"堡垒豪宅"：混凝土花盆栽一圈酸橙树，树丛后面是壕沟，壕沟后是激光入侵探测系统，前门 3 英寸厚实心钢板配 13 道锁栓，屋内藏着 2000 磅重门的安全避难室，连景观设计都是防御工事。

为 CEO 提供住宅安防的企业，创下 2003 年以来最高增长。UNH CEO 在曼哈顿街头遭枪击身亡之后，趋势陡然加速。

枪声响到了 AI 大佬家门口

4 月 11 日凌晨 4 点：一个 20 岁男孩从德州飞到加州，手提煤油罐站在 Sam Altman 价值 2700 万美元的豪宅门前，点燃汽油弹扔了进去。
一个半小时后他出现在 OpenAI 总部，抄椅子砸玻璃门喊："我要烧了这里，杀光里面所有人。" FBI 从他身上搜出一份文件，标题"你的最后警告"，列着多名 AI 公司 CEO 和投资人的姓名与家庭住址。
两天后周日凌晨：Altman 家再次遇袭——一辆本田轿车在门口短暂停留，副驾驶把手伸出窗外朝房子开了一枪然后逃逸。
3 月底：旧金山市中心大规模反 AI 游行，"Stop the AI Race""Don't Build Skynet" 牌子，在 Anthropic、OpenAI、xAI 办公室外发表演讲。Bernie Sanders 在国会警告："人类可能真的会失去对这个星球的控制。"

据说马斯克也非常担心被枪杀，圈子里是公开的秘密。

背后的恐惧很朴素：如果 AI 接管了大部分生产，人不再是经济运转的必要参与者，那过去所有"你贡献了多少、你该分多少"的社会契约就全失效了。剩下的只有一个极简的权力结构：谁控制了 GPU 和电力，谁就控制了一切。阶层不是被拉开了，是被压扁了——一边是极少数人，另一边是所有其他人。

"两年之后的美国大选，最火的竞选主题，肯定是 AI 与社会的关系问题。甚至会出现 AI 时代的卢德运动。"

尾声 + Wayne 的复盘

在写满"跟不上"的笔记本最后，孟醒留下了一个让人意外的乐观注脚。

Anthropic 的 Dario Amodei 在内部说过一句话：在 AI 的帮助下，癌症在某种意义上已经被攻克了——不是消失了，而是它有可能变成一种不会死人的慢性病，只是治疗费用还太贵，普及需要时间。

这次硅谷之行，孟醒看得最多的创业方向是 AI4S、AI for Biotech，很多大模型公司出来的人不懂医疗，但他们想用 AI 改变这个行业。

这半个月我看到了那么多"跟不上"，这确实让人焦虑。但如果 AI 真的在几年内让癌症变成慢性病、让材料科学快进二十年，那么这一场"跟不上"，可能是人类发展历史上最大的一次提速。

"我家宝宝今年两岁，明年可能会有第二个孩子，他们这一代要面对的那个世界什么样，我现在完全没有想象力去构建。但我希望，在他们长大的世界里，多一些因 AI 而被治愈的人，而不是有更多燃烧瓶和枪声，砸向 AI 从业者的家门口。"

全员 token-maxxing
一场没人敢停的军备竞赛

目录

三句话读懂