云栈社区»论坛 › 开发者广场「Dev Plaza」 › 6个CTO跑去Anthropic当IC，这信号比benchmark靠谱

发回帖发新帖

5680 积分	0 好友	756 主题

发消息

6个CTO跑去Anthropic当IC，这信号比benchmark靠谱

发表于 2026-5-2 22:54:34 | 查看: 179| 回复: 0

一份名单
4 月底 Henry Shi 在 X 上发了条推。他列了一份 6 人名单：Adept、Super.com、Box、Instagram、Workday、You.com，6 家估值都过 10 亿美金的公司，最近一年里——CTO 全跑了。
跑去哪里？同一个地方：Anthropic。
跑去做什么？不是去当 VP，不是去管团队，是回到代码里——MTS（Member of Technical Staff），是个体贡献者岗位。
Henry 自己是这 6 个人之一，第 5 个，他自己写了这条推。

6位CTO跳槽Anthropic时间线
我看到这条推的时候，第一反应是「时间密度有点反常」。2025 年全年只有 2 个，2026 年前 4 个月就有 4 个。
第二反应是「对象组合也反常」。这 6 个人不是同一拨人。Adept 是 AI native 公司，Super.com 是消费 unicorn，Box 是企业 SaaS，Instagram 是社交媒体，Workday 是 HR 软件，You.com 是搜索创业。覆盖了从 0 到 1 各种阶段的公司，没有共同分母。
但最反常的是这一条：第 1 个名字，从 Adept 跳到 Anthropic 的人，不是商业 CTO——是 Niki Parmar。

如果这个名字陌生，我说另一个东西你就懂了：《Attention Is All You Need》。2017 年那篇 paper，也就是过去十年所有 AI 突破的源头那篇 Transformer 论文。Niki Parmar 是它的 8 个作者之一。
她在 Adept 当过 CTO。Adept 被 Amazon 收购后，她没去 Amazon。她做了别的——选择去 Anthropic，当一个 IC。后来她公开提到 Claude 3.7 Sonnet 时写的是这么一句：

「Claude 3.7 是一个出色的模型，尤其在复杂任务和编码上。我很高兴自己参与了它的研发。」

写过 Transformer 的人，没去当 advisor，没去开 podcast，没去拿超大 offer。她去 Anthropic 写代码了。
接下来我打算做一件事：把这 6 个人挨个查清楚。每个人的来路、走向、说过什么没说什么。然后我们再回头看，这份 6 人名单到底意味着什么。

六份档案

六份档案卡片

1 · Niki Parmar · Adept AI（2024 年 12 月）

她是 Transformer 论文的 8 作者之一。
2017 年那篇 paper 在 Google Brain 写出来的时候，整个 AI 圈大部分人还没意识到它会改变什么。Niki 离开 Brain 后跟 Ashish Vaswani（也是 Transformer 作者）一起创办了 Adept AI——一家做「能用电脑的 AI agent」的创业公司。她在 Adept 当 co-founder + CTO。
2024 年 6 月，Adept 被 Amazon acqui-hire。核心团队里大部分人跟着 David Luan（另一位 co-founder）进了 Amazon AGI Lab。Niki 没去。
她去了 Anthropic。没拿 title，没拿管理岗，就是 MTS。
入职是 2024 年 12 月。她安静地写了 3 个月代码，2025 年 2 月才在 X 上公开宣布。那条推总共两段话，没有「我的下一段旅程」、没有「期待与同事们」，只有一句：

「Claude 3.7 是一个出色的模型，尤其在复杂任务和编码上。我很高兴自己参与了它的研发。」

写过 Transformer 的人，最在乎的是「我参与研发了下一个值得参与研发的东西」。这句话本身就是答案。

2 · Henry Shi · Super.com（2025 年 7 月）

Super.com 是一家消费旅行公司，年化收入 2 亿美金，5000 万用户。Henry 是联合创始人 + CTO + COO，干了 8 年。
2024 年 8 月他在 X 上写「这是我作为 CTO 的最后一个月」。一年后他公开自己去了 Anthropic。
他是 6 个人里唯一写过详细离职 manifesto 的人。Substack 一篇长文，标题：「我离开了一个 ARR $200M 的公司，去构建 safe AGI」。其中一段最直接：

「与其在 AI 革命之上做产品，不如帮忙创造它本身。」

他还在另一个地方写过：

「在 Anthropic，能拥有非常大的 scope，但没有管理人的负担——这是 best of both worlds。」

这是 6 份档案里唯一一份「亲口告诉你为什么走」的资料。其他人要么静默更新 LinkedIn，要么由前公司发言人短评。Henry 的 manifesto 是这条故事的天然 narrator——所以这条推是他发的，他在为这群人代言。

3 · Box CTO（2025 年 12 月）

诚实地说：这条数据点信息不足。
Henry 推文里写「Box CTO → MTS（Dec 2025）」，但主流媒体（OfficeChai、TheNextWeb、PYMNTS）的综述里都没点名这个人是谁。Box 的现任 CTO Ben Kus 自 2020 年起在职，目前依然在 Box——所以离开的不是他。
可能性有几个：是某位前任 CTO、或者 deputy CTO 级别的工程负责人、或者 Box 内部某条产品线的 CTO 头衔。Henry 在 Anthropic 内部，可能是从入职名单看到的，没经过外部新闻稿。
我不在这条推后面瞎补名字。这条数据点保留在 6 人名单里，但当事人信息存疑。
我把它当成「这 6 个人里的第 6.5 个」——存在但模糊。

4 · Mike Krieger · Instagram（2026 年 1 月）

Instagram 联合创始人 + 第一任 CTO。
但这条 case 比表面复杂：Krieger 不是从 Instagram 直接跳到 Anthropic 当 IC 的。
时间线是这样：2018 年从 Instagram 离开 → 创办 Artifact（被 Yahoo 收购）→ 2024 年 5 月以 CPO 身份加入 Anthropic → 2026 年 1 月 14 日，主动从 CPO 转到 MTS，与 Anthropic co-founder Ben Mann 一起 co-lead Anthropic Labs（内部产品孵化器）。
所以严格说，这条是「CPO 内部转 IC」，不是「Instagram CTO 直跳 IC」。Henry 把它放进 6 人列表是叙事 stretch。
但这个 stretch 有它的意思——Krieger 自己是这么解释的：

「我们处在 AI 的一个分水岭时刻——模型能力进步如此之快，塑造它如何被使用的窗口期就是现在。」
「回到 builder mode。」

他放下的是 CPO 这个 C-suite 头衔。这件事本身比「他是不是 Instagram→直跳」更有意思。

5 · Peter Bailis · Workday（2026 年 3 月）

这条是 6 个里舆论冲击最大的。
Bailis 的履历：Stanford CS 教授 → 创办 Sisu Data 当 CEO → Google Cloud（带企业数据 AI 方向）→ 2025 年 5 月接任 Workday CTO，主导其 agentic AI 战略。
他在 Workday CTO 这个位置上，干了不到 1 年。
2026 年 2 月，Workday CEO Carl Eschenbach 刚公开说「Anthropic、Google、OpenAI 都在用 Workday 的软件」。下个月，Anthropic 把 Workday 自己的 CTO 挖走了——买家挖走了卖家的 CTO。
Bailis 本人没公开发声，只有 Workday 官方发言人短评：「我们感谢 Peter 的贡献，祝他下一段旅程顺利。」
但 Anthropic 内部把他的方向写得很清楚：focus on reinforcement learning engineering。
一个企业 SaaS 公司的 CTO，刚到位 10 个月就放下管理职位，跑去做 RL engineering——你很难给这事编一个商业上合理的解释。

6 · Bryan McCann · You.com（2026 年 3 月）

McCann 学术背景比 Bailis 还重。
Salesforce Research 出身，CTRL 模型的论文一作——那是 2019 年最早一批可控文本生成的模型之一。decaNLP 论文也有他。Google Scholar 上引用数过万。2020 年跟 Richard Socher 一起创办 You.com，做 AI search，干了 6 年 CTO。
2026 年 3 月，与 Bailis 同月离开。You.com 把内部早期工程师 Saahil Jain 升任 CTO 接替。
McCann 本人没发推，只是 LinkedIn 静默更新。但他的 GitHub 和 Google Scholar 还在更新——人没退休，只是退出了管理岗位。
他与 Niki Parmar 形成了文章的对称——两个写过 paper 的研究型 CTO，都选择放下 title 去 Anthropic 当个体贡献者。
Anthropic 在挖的不是商业 CTO，是 research-heavy founder-CTO。

三个反常合并起来看

把这 6 份档案放在一起，三个反常浮出来。

反常一 · 钱不是变量
2025 年到 2026 年，Meta 一直在为 superintelligence team 开九位数 offer——一年里被 The Information 和 Bloomberg 写过好几轮。这 6 个人都不缺钱，他们的前公司估值都过 10 亿。如果是出价决定流向，最该赢的是 Meta，不是 Anthropic。
但赢的是 Anthropic。

反常二 · 头衔在反向流动
CTO → IC，是反向 career move。在硅谷叙事里，CTO 是终点，IC 是起点。但这 6 个人主动放下了 C-suite，回到代码里。Mike Krieger 的措辞最直接：「回到 builder mode」。Henry 的措辞是：「best of both worlds——大 scope，没人管负担」。
放下 title，对个人 brand 没好处，对家庭收入也未必有好处——这不是优化路径决定的选择，是某种判断决定的。

反常三 · 6 个人不是同一类
AI native（Niki Parmar / Bryan McCann）+ 消费 unicorn（Henry Shi）+ 企业 SaaS（Peter Bailis / Box CTO）+ 社交媒体（Mike Krieger）。没有任何一个职业类别能同时解释这 6 个迁移。
但有一件事是 6 个人都做了：选 Anthropic，选 IC。
那么共同的不是 background，是某种共同判断。

三个推论，按强度排

这件事可以怎么解读？我整理出三个推论，从弱到强：

推论 A · 文化对（弱）
也许 Anthropic 文化好、IC 通道做得好。反方证据：6 个人来自 6 种不同公司文化，从 Instagram 到 Workday，他们以前的工作环境差异巨大。如果是文化决定，应该来自相近背景的人聚集，而不是覆盖所有阶段的公司都给同一个答案。

推论 B · 6 人对 frontier 现状有同向判断（中）
也许这 6 个 builder 各自独立看到了同一件事：当前最接近 frontier 的模型来自 Anthropic，所以选择「在那里写代码」。这个推论的强度比 A 高——因为它解释了「为什么放下管理岗」（如果你判断对了，离 model 越近权力越大；管 200 人只是离前沿越来越远）。

推论 C · 模型实际比公开 benchmark 显示的还要超前（强）
如果一群 builder 都往同一个 lab 跑，他们看到的可能不是「Anthropic 公司好」，而是「Anthropic 模型未来一年的轨迹」。
这是最强的推论，因为它不依赖文化判断，也不依赖个人偏好。它只依赖一件事：builder 自己用过、跑过、在内部见过 model 的实际能力曲线。
我没办法证明 C 是对的。但有一类硬证据可以参考：自己天天用 Claude Code 的开发者，能不能从手感上佐证这条曲线。
下一节我自己来回答这个。

作为开发者的下注

我天天用 Claude Code。
Opus 4.6 跑 agent 任务的稳定度，从今年 1 月到现在的体感差距，比公开 benchmark 上显示的差距大。具体说：以前一个长任务（比如「给我读这个 repo，然后写一个 5 文件改动的 PR」）跑一次成功率大概 60%，需要我盯着回头修。现在 Opus 4.6 跑同样任务，一次成功率接近 90%，而且我经常发现——它会先检查我让它做的事，发现矛盾会问回来，而不是闷头写出错的代码。
Opus 4.7 1M context 是另一件事。一个 600 行的 SKILL.md + 8 个 references + 5 个 scripts 全部 paste 进去做 holistic review，4.7 能 hold 住整个仓库的 mental model，4.6 hold 不住。这个差距没法在 SWE-bench 之类的 benchmark 上看出来，因为 benchmark 不测「跨 N 个文件 + 上下文超过 200k token」的任务。
Skill Creator 2.0 今年 3 月 ship 的版本里，trigger eval framework 是把 60/40 train/test split 直接做进了产品。这个东西是「把研究流程产品化」——不是从研究博客抄一个图，是真的把 research workflow 摁进了产品。这种东西的设计需要研发和产品的人在一个 room 里。
把这三件事放在一起：Anthropic 的产品质量和模型质量在以一个 benchmark 没充分显示的速度往前走。
这不是结论，是一线开发者的体感。但「6 个 CTO 同时跑过来」的人才信号 + 我自己每天用 Claude Code 的体感 + 这两条互相印证——这就是 Niki Parmar 那句「我很高兴参与了它的研发」背后的空间。
如果你也天天用 Claude Code，你大概知道我在说什么。

历史对照

「人才聚集是不是真的预言 benchmark」这件事，过去十年有几次可以对照：

人才聚集与基准时间差历史对照

· Google Brain 2014-2017 → Transformer paper（2017 年 6 月）。中间时间差大约 12-18 个月。
· OpenAI 2019 → GPT-3（2020 年 6 月）。时间差大约 12 个月。
· DeepMind 2014 → AlphaGo（2016 年 3 月）。时间差超过 36 个月。反例——这次人才聚集发生在公开能见度极低的项目里，benchmark 出来之前业内基本没人能预判。

最干净的样本，其实是 Anthropic 自己。
2020 年 12 月，Dario Amodei 带 7 个核心研究员从 OpenAI 离开，创办 Anthropic。当时业内大多数人不知道这群人会做什么，但「核心团队集体迁移到方向明确的小公司」这个信号，在 2 年后被 Claude 1 兑现了。
把这个 framework 套回 6 CTO 的现象上：

「集体迁移到方向明确的小公司」是过去十年唯一干净的 benchmark 领先指标。

它需要同时满足两个条件：
· 公开可见——名单是公开的，不是 Google 内部 transfer。
· 方向特异——目标 lab 的方向是清楚的，不是泛泛跳槽。

6 个 CTO + 1 个 Transformer 作者，跑去 Anthropic 当 IC——同时满足了这两个条件。
这不预言 model 一定会更好。它只预言：如果你只看 benchmark，你大概率会比这群 builder 晚 12-24 个月知道发生了什么。
而 Anthropic 自己，曾经就是被这种信号预言过的 lab。现在它又在吸引同样的人才聚集——这件事的对称性，比 Henry 那条推本身更值得记住。

本文首发于云栈社区，一个开发者技术论坛。

上一篇：Warp 开源解读：这款 Rust 写的 AI 终端，AGPL 协议下如何实现智能代码审查？
下一篇：三星电子宣布退出中国家电市场：彩电冰箱洗衣机市占率均不足4%

Anthropic, Transformer, 个体贡献者, 人才流动, 基准测试

收藏0 回复显示全部楼层举报