找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

5403

积分

0

好友

743

主题
发表于 昨天 22:54 | 查看: 5| 回复: 0

一份名单
4 月底 Henry Shi 在 X 上发了条推。他列了一份 6 人名单:Adept、Super.com、Box、Instagram、Workday、You.com,6 家估值都过 10 亿美金的公司,最近一年里——CTO 全跑了。
跑去哪里?同一个地方:Anthropic
跑去做什么?不是去当 VP,不是去管团队,是回到代码里——MTS(Member of Technical Staff),是个体贡献者岗位。
Henry 自己是这 6 个人之一,第 5 个,他自己写了这条推。

6位CTO跳槽Anthropic时间线
我看到这条推的时候,第一反应是「时间密度有点反常」。2025 年全年只有 2 个,2026 年前 4 个月就有 4 个
第二反应是「对象组合也反常」。这 6 个人不是同一拨人。Adept 是 AI native 公司,Super.com 是消费 unicorn,Box 是企业 SaaS,Instagram 是社交媒体,Workday 是 HR 软件,You.com 是搜索创业。覆盖了从 0 到 1 各种阶段的公司,没有共同分母。
最反常的是这一条:第 1 个名字,从 Adept 跳到 Anthropic 的人,不是商业 CTO——是 Niki Parmar。  

如果这个名字陌生,我说另一个东西你就懂了:《Attention Is All You Need》。2017 年那篇 paper,也就是过去十年所有 AI 突破的源头那篇 Transformer 论文。Niki Parmar 是它的 8 个作者之一。
她在 Adept 当过 CTO。Adept 被 Amazon 收购后,她没去 Amazon。她做了别的——选择去 Anthropic,当一个 IC。后来她公开提到 Claude 3.7 Sonnet 时写的是这么一句:  

「Claude 3.7 是一个出色的模型,尤其在复杂任务和编码上。我很高兴自己参与了它的研发。」  

写过 Transformer 的人,没去当 advisor,没去开 podcast,没去拿超大 offer。她去 Anthropic 写代码了。
接下来我打算做一件事:把这 6 个人挨个查清楚。每个人的来路、走向、说过什么没说什么。然后我们再回头看,这份 6 人名单到底意味着什么。  

六份档案

六份档案卡片  

1 · Niki Parmar · Adept AI(2024 年 12 月)

她是 Transformer 论文的 8 作者之一。
2017 年那篇 paper 在 Google Brain 写出来的时候,整个 AI 圈大部分人还没意识到它会改变什么。Niki 离开 Brain 后跟 Ashish Vaswani(也是 Transformer 作者)一起创办了 Adept AI——一家做「能用电脑的 AI agent」的创业公司。她在 Adept 当 co-founder + CTO。
2024 年 6 月,Adept 被 Amazon acqui-hire。核心团队里大部分人跟着 David Luan(另一位 co-founder)进了 Amazon AGI Lab。Niki 没去。
她去了 Anthropic。没拿 title,没拿管理岗,就是 MTS
入职是 2024 年 12 月。她安静地写了 3 个月代码,2025 年 2 月才在 X 上公开宣布。那条推总共两段话,没有「我的下一段旅程」、没有「期待与同事们」,只有一句:  

「Claude 3.7 是一个出色的模型,尤其在复杂任务和编码上。我很高兴自己参与了它的研发。」  

写过 Transformer 的人,最在乎的是「我参与研发了下一个值得参与研发的东西」。这句话本身就是答案。  

2 · Henry Shi · Super.com(2025 年 7 月)

Super.com 是一家消费旅行公司,年化收入 2 亿美金,5000 万用户。Henry 是联合创始人 + CTO + COO,干了 8 年。
2024 年 8 月他在 X 上写「这是我作为 CTO 的最后一个月」。一年后他公开自己去了 Anthropic。
他是 6 个人里唯一写过详细离职 manifesto 的人。Substack 一篇长文,标题:「我离开了一个 ARR $200M 的公司,去构建 safe AGI」。其中一段最直接:  

「与其在 AI 革命之上做产品,不如帮忙创造它本身。」  

他还在另一个地方写过:  

「在 Anthropic,能拥有非常大的 scope,但没有管理人的负担——这是 best of both worlds。」  

这是 6 份档案里唯一一份「亲口告诉你为什么走」的资料。其他人要么静默更新 LinkedIn,要么由前公司发言人短评。Henry 的 manifesto 是这条故事的天然 narrator——所以这条推是他发的,他在为这群人代言。  

3 · Box CTO(2025 年 12 月)

诚实地说:这条数据点信息不足
Henry 推文里写「Box CTO → MTS(Dec 2025)」,但主流媒体(OfficeChai、TheNextWeb、PYMNTS)的综述里都没点名这个人是谁。Box 的现任 CTO Ben Kus 自 2020 年起在职,目前依然在 Box——所以离开的不是他。
可能性有几个:是某位前任 CTO、或者 deputy CTO 级别的工程负责人、或者 Box 内部某条产品线的 CTO 头衔。Henry 在 Anthropic 内部,可能是从入职名单看到的,没经过外部新闻稿。
我不在这条推后面瞎补名字。这条数据点保留在 6 人名单里,但当事人信息存疑
我把它当成「这 6 个人里的第 6.5 个」——存在但模糊。  

4 · Mike Krieger · Instagram(2026 年 1 月)

Instagram 联合创始人 + 第一任 CTO。
这条 case 比表面复杂:Krieger 不是从 Instagram 直接跳到 Anthropic 当 IC 的。
时间线是这样:2018 年从 Instagram 离开 → 创办 Artifact(被 Yahoo 收购)→ 2024 年 5 月以 CPO 身份加入 Anthropic → 2026 年 1 月 14 日,主动从 CPO 转到 MTS,与 Anthropic co-founder Ben Mann 一起 co-lead Anthropic Labs(内部产品孵化器)。
所以严格说,这条是「CPO 内部转 IC」,不是「Instagram CTO 直跳 IC」。Henry 把它放进 6 人列表是叙事 stretch。
但这个 stretch 有它的意思——Krieger 自己是这么解释的:  

「我们处在 AI 的一个分水岭时刻——模型能力进步如此之快,塑造它如何被使用的窗口期就是现在。」
「回到 builder mode。」  

他放下的是 CPO 这个 C-suite 头衔。这件事本身比「他是不是 Instagram→直跳」更有意思。  

5 · Peter Bailis · Workday(2026 年 3 月)

这条是 6 个里舆论冲击最大的。
Bailis 的履历:Stanford CS 教授 → 创办 Sisu Data 当 CEO → Google Cloud(带企业数据 AI 方向)→ 2025 年 5 月接任 Workday CTO,主导其 agentic AI 战略。
他在 Workday CTO 这个位置上,干了不到 1 年。
2026 年 2 月,Workday CEO Carl Eschenbach 刚公开说「Anthropic、Google、OpenAI 都在用 Workday 的软件」。下个月,Anthropic 把 Workday 自己的 CTO 挖走了——买家挖走了卖家的 CTO
Bailis 本人没公开发声,只有 Workday 官方发言人短评:「我们感谢 Peter 的贡献,祝他下一段旅程顺利。」
但 Anthropic 内部把他的方向写得很清楚:focus on reinforcement learning engineering
一个企业 SaaS 公司的 CTO,刚到位 10 个月就放下管理职位,跑去做 RL engineering——你很难给这事编一个商业上合理的解释。  

6 · Bryan McCann · You.com(2026 年 3 月)

McCann 学术背景比 Bailis 还重。
Salesforce Research 出身,CTRL 模型的论文一作——那是 2019 年最早一批可控文本生成的模型之一。decaNLP 论文也有他。Google Scholar 上引用数过万。2020 年跟 Richard Socher 一起创办 You.com,做 AI search,干了 6 年 CTO。
2026 年 3 月,与 Bailis 同月离开。You.com 把内部早期工程师 Saahil Jain 升任 CTO 接替。
McCann 本人没发推,只是 LinkedIn 静默更新。但他的 GitHub 和 Google Scholar 还在更新——人没退休,只是退出了管理岗位
他与 Niki Parmar 形成了文章的对称——两个写过 paper 的研究型 CTO,都选择放下 title 去 Anthropic 当个体贡献者。
Anthropic 在挖的不是商业 CTO,是 research-heavy founder-CTO。  

三个反常合并起来看

把这 6 份档案放在一起,三个反常浮出来。  

反常一 · 钱不是变量
2025 年到 2026 年,Meta 一直在为 superintelligence team 开九位数 offer——一年里被 The Information 和 Bloomberg 写过好几轮。这 6 个人都不缺钱,他们的前公司估值都过 10 亿。如果是出价决定流向,最该赢的是 Meta,不是 Anthropic。
但赢的是 Anthropic。  

反常二 · 头衔在反向流动
CTO → IC,是反向 career move。在硅谷叙事里,CTO 是终点,IC 是起点。但这 6 个人主动放下了 C-suite,回到代码里。Mike Krieger 的措辞最直接:「回到 builder mode」。Henry 的措辞是:「best of both worlds——大 scope,没人管负担」。
放下 title,对个人 brand 没好处,对家庭收入也未必有好处——这不是优化路径决定的选择,是某种判断决定的。  

反常三 · 6 个人不是同一类
AI native(Niki Parmar / Bryan McCann)+ 消费 unicorn(Henry Shi)+ 企业 SaaS(Peter Bailis / Box CTO)+ 社交媒体(Mike Krieger)。没有任何一个职业类别能同时解释这 6 个迁移
但有一件事是 6 个人都做了:选 Anthropic,选 IC。
那么共同的不是 background,是某种共同判断。  

三个推论,按强度排

这件事可以怎么解读?我整理出三个推论,从弱到强:  

推论 A · 文化对(弱)
也许 Anthropic 文化好、IC 通道做得好。反方证据:6 个人来自 6 种不同公司文化,从 Instagram 到 Workday,他们以前的工作环境差异巨大。如果是文化决定,应该来自相近背景的人聚集,而不是覆盖所有阶段的公司都给同一个答案。  

推论 B · 6 人对 frontier 现状有同向判断(中)
也许这 6 个 builder 各自独立看到了同一件事:当前最接近 frontier 的模型来自 Anthropic,所以选择「在那里写代码」。这个推论的强度比 A 高——因为它解释了「为什么放下管理岗」(如果你判断对了,离 model 越近权力越大;管 200 人只是离前沿越来越远)。  

推论 C · 模型实际比公开 benchmark 显示的还要超前(强)
如果一群 builder 都往同一个 lab 跑,他们看到的可能不是「Anthropic 公司好」,而是「Anthropic 模型未来一年的轨迹」。
这是最强的推论,因为它不依赖文化判断,也不依赖个人偏好。它只依赖一件事:builder 自己用过、跑过、在内部见过 model 的实际能力曲线。
我没办法证明 C 是对的。但有一类硬证据可以参考:自己天天用 Claude Code 的开发者,能不能从手感上佐证这条曲线。
下一节我自己来回答这个。  

作为开发者的下注

我天天用 Claude Code。
Opus 4.6 跑 agent 任务的稳定度,从今年 1 月到现在的体感差距,比公开 benchmark 上显示的差距大。具体说:以前一个长任务(比如「给我读这个 repo,然后写一个 5 文件改动的 PR」)跑一次成功率大概 60%,需要我盯着回头修。现在 Opus 4.6 跑同样任务,一次成功率接近 90%,而且我经常发现——它会先检查我让它做的事,发现矛盾会问回来,而不是闷头写出错的代码。
Opus 4.7 1M context 是另一件事。一个 600 行的 SKILL.md + 8 个 references + 5 个 scripts 全部 paste 进去做 holistic review,4.7 能 hold 住整个仓库的 mental model,4.6 hold 不住。这个差距没法在 SWE-bench 之类的 benchmark 上看出来,因为 benchmark 不测「跨 N 个文件 + 上下文超过 200k token」的任务。
Skill Creator 2.0 今年 3 月 ship 的版本里,trigger eval framework 是把 60/40 train/test split 直接做进了产品。这个东西是「把研究流程产品化」——不是从研究博客抄一个图,是真的把 research workflow 摁进了产品。这种东西的设计需要研发和产品的人在一个 room 里。
把这三件事放在一起:Anthropic 的产品质量和模型质量在以一个 benchmark 没充分显示的速度往前走
这不是结论,是一线开发者的体感。但「6 个 CTO 同时跑过来」的人才信号 + 我自己每天用 Claude Code 的体感 + 这两条互相印证——这就是 Niki Parmar 那句「我很高兴参与了它的研发」背后的空间。
如果你也天天用 Claude Code,你大概知道我在说什么。  

历史对照

「人才聚集是不是真的预言 benchmark」这件事,过去十年有几次可以对照:  

人才聚集与基准时间差历史对照  

· Google Brain 2014-2017 → Transformer paper(2017 年 6 月)。中间时间差大约 12-18 个月。
· OpenAI 2019 → GPT-3(2020 年 6 月)。时间差大约 12 个月。
· DeepMind 2014 → AlphaGo(2016 年 3 月)。时间差超过 36 个月。反例——这次人才聚集发生在公开能见度极低的项目里,benchmark 出来之前业内基本没人能预判。  

最干净的样本,其实是 Anthropic 自己。
2020 年 12 月,Dario Amodei 带 7 个核心研究员从 OpenAI 离开,创办 Anthropic。当时业内大多数人不知道这群人会做什么,但「核心团队集体迁移到方向明确的小公司」这个信号,在 2 年后被 Claude 1 兑现了
把这个 framework 套回 6 CTO 的现象上:  

「集体迁移到方向明确的小公司」是过去十年唯一干净的 benchmark 领先指标。  

它需要同时满足两个条件:
· 公开可见——名单是公开的,不是 Google 内部 transfer。
· 方向特异——目标 lab 的方向是清楚的,不是泛泛跳槽。  

6 个 CTO + 1 个 Transformer 作者,跑去 Anthropic 当 IC——同时满足了这两个条件。
这不预言 model 一定会更好。它只预言:如果你只看 benchmark,你大概率会比这群 builder 晚 12-24 个月知道发生了什么。
而 Anthropic 自己,曾经就是被这种信号预言过的 lab。现在它又在吸引同样的人才聚集——这件事的对称性,比 Henry 那条推本身更值得记住。  

本文首发于云栈社区,一个开发者技术论坛。




上一篇:Warp 开源解读:这款 Rust 写的 AI 终端,AGPL 协议下如何实现智能代码审查?
下一篇:三星电子宣布退出中国家电市场:彩电冰箱洗衣机市占率均不足4%
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-5-3 02:10 , Processed in 0.983704 second(s), 39 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表