你用了多少 Token?
这已经成为 硅谷最新绩效指标
当“刷 AI 消耗量”变成升职加薪的新赛道,打工人该怎么看?
一位 OpenAI 工程师,单周消耗了 2100亿个 token ——相当于 33 个英文维基百科的文字量。而这个数字,正挂在公司内部排行榜的榜首,被同事们羡慕地观摩着。
欢迎来到 2026 年硅谷最新的内卷竞技场。
什么是“Token 消耗量考核”?
事情的起点,是《纽约时报》科技专栏作家 Kevin Roose 今年 3 月的一篇深度报道。他发现,Meta、OpenAI 等顶级科技公司的内部,正在悄然兴起一种新的绩效评估维度:员工消耗的 LLM(大语言模型)token 数量。
Token 是大语言模型处理文本的基本单位。大致上,一个英文单词约等于 1-2 个 token,而 API 调用的费用,也正是按 token 数量计费的。换句话说,你的 AI 用得越多、问题越复杂、上下文越长,消耗的 token 就越多。
在一些公司,这个数字已经不只是成本报表上的一行数字——它早已不再是成本报表上一行冰冷的数字,它正演变为衡量“你到底有没有拥抱 AI”的可量化证明。
2100亿
某 OpenAI 工程师
单周 token 消耗量
33个
相当于多少个
英文维基百科
$150,000
某 Anthropic 开发者
单月 Claude Code 账单
超薪资
瑞典工程师 Max Linder
的 Claude Code 开销
数据来源:《纽约时报》Kevin Roose 报道 及 Gizmodo(2026年3月)
“Token 排行榜”正在改变职场文化
据报道,Meta 和 Shopify 的管理者已经在绩效考核中纳入了 AI 使用量:重度使用者受到奖励,用得少的员工则会被提醒,甚至被认为“效率不足”。
这种现象有了一个专有名词—— “Tokenmaxxing” (Token 极大化)。像打游戏刷排名一样,一些工程师开始有意识地最大化自己的 token 消耗量,以期在公司内部的 AI 使用排行榜上获得更高位次。
“我们用的 Claude Code,光这一项的费用就超过了我的工资——但公司买单。”
—— Max Linder,斯德哥尔摩某科技公司软件工程师,接受《纽约时报》采访
Meta 人力资源负责人 Janelle Gale 在内部备忘录中明确表示:“随着我们迈向 AI 原生的未来,我们希望认可那些帮助我们更快到达那里的人。” 自 2026 年起,“AI 驱动的影响力”已正式成为所有 Meta 员工(从工程师到营销人员)绩效考核的核心维度之一。
| 公司 |
AI 绩效考核动态 |
正式纳入考核 |
| Meta |
2026年起正式将“AI驱动影响力”列为核心考核项,影响晋升与奖金 |
✅ 已落地 |
| Shopify |
要求员工将 AI 用于日常任务,管理层将 AI 使用量纳入评估 |
✅ 已落地 |
| OpenAI |
内部排行榜展示各员工 token 消耗情况,形成竞争氛围 |
⚡ 文化层面 |
| Microsoft |
高管明确表示 AI 使用“不再是可选项”,持续推动内部采纳 |
⚡ 推进中 |
| Google |
Sundar Pichai 在全员会议明确要求员工使用 AI |
⚡ 推进中 |
| Duolingo / Box |
已要求员工在常规任务中强制使用 AI 工具 |
✅ 已落地 |
扎克伯格在 Meta 第四季度财报电话会议上对投资者放话:“2026 年将是 AI 开始彻底改变我们工作方式的一年。” AI 使用已不再是加分项,而是生存线。
这个逻辑,到底有没有道理?
支持者的逻辑很直接:AI 工具本质上是效率乘数,员工使用越多,意味着他们用 AI 处理了更复杂的任务,或者说依赖 AI 完成了更多工作。Token 是可量化、可追踪的数字,对于追求数据驱动决策的科技公司来说,这确实是一个颇具吸引力的 KPI。
但批评者的反驳同样犀利。Gizmodo 的记者做了一个绝妙的比喻:
“用消耗的子弹数量来衡量士兵的战场表现——即便是漫无目的的子弹,也算数。”
—— Gizmodo,2026年3月报道
MIT 斯隆管理学院应用经济学教授 Roberto Rigobon 则提出了一个更深层的隐忧:将认知任务外包给 AI,可能导致员工底层技能的退化——就像人们用了计算器就忘了心算一样。
⚠️ 批评者列举的四大风险
- 指标扭曲行为:员工为刷数据而使用 AI,而非为解决真实问题。
- 成本失控:慷慨的 token 配额催生消耗螺旋,账单可能超过员工薪资。
- 技能退化:长期依赖 AI 可能侵蚀工程师的基础独立思考能力。
- 心理压力:强制竞争排名带来内卷焦虑,高消耗者成为标杆,低消耗者背负压力。
Gartner 的研究更是给这股热潮泼了一盆冷水:在现有的 AI 投资中,只有五分之一能够带来可量化的 ROI。单纯用消耗量代替实际效果,很可能只是把浪费换了一种更时髦的形式。
“Token 即生产力”,还是新时代的形式主义?
这场争议,本质上是关于 如何度量知识工作者价值 这一古老难题的新版本:当工作成果难以直接量化,我们就用那些可量化的代理指标来替代——从代码行数、会议数量、工时,现在又轮到了 token。
历史一次次证明,这类“代理指标”都不可避免地导致“为了指标而优化指标”的扭曲效应,最终与提升生产力的初衷背道而驰。
当然,我们也可以换一个角度思考:在 AI Agent 已经能够自主处理大量工程任务的 2026 年,“你调度了多少 AI 算力来完成工作”本身,是否真的就是一种新型生产力的体现?关键在于,消耗量只有与输出质量紧密挂钩时,它的统计才有意义。 空有消耗而无实质产出,不过是另一种形式的资源浪费。
💡 更合理的 AI 绩效框架建议(业内声音)
- 透明化预算:明确哪些 token 开销由公司承担,避免隐性负担转移给员工。
- 组合指标:将 token 使用量与代码质量、问题解决速度、创新输出等定性指标结合评估。
- 监控健康度:跟踪是否存在因“刷 token”引发的职业倦怠与无效内卷现象。
- 公平准入:确保所有岗位都有合理的 token 配额和访问权限,而不是只有明星工程师独享大额预算。
写在最后
无论硅谷这场以 Token 论英雄的实验最终走向何方,有一件事已经确定:在这里,对 AI 的使用正从一项“可选的技能加分项”,迅速转变为某种“职业生存要件”。
对于身处其中的普通从业者而言,与其焦虑地盯着排行榜上那个不断跳动的数字,或许更应该回归工具使用的本质—— AI 用得好,关键不在于用得多,而在于用得准、用得巧。 真正值得在周报里写上一笔的,不是你今天烧掉了多少亿 token,而是那些 token 究竟帮你攻克了什么难题,创造了什么独特的价值。
关于技术趋势与职场文化的碰撞,你可以在 云栈社区 的开发者广场找到更多有趣的观察和讨论。