大语言模型究竟抢了多少人的饭碗,一直是个令千万打工人深感焦虑的未解之谜。Anthropic 刚刚发布了一项基于真实使用数据的研究,清晰勾勒出当前劳动力市场面对 人工智能 的真实境况。

研究人员跳出空洞的理论预测,将美国政府的职业数据库,与 大模型 的真实使用记录交叉比对,精准测算出了各个职业被现实替代的准确比例。
最新数据揭示,高暴露在机器面前的工作者普遍年纪偏大,且拥有更高的学历和薪水。虽然大众时刻担忧的大范围失业潮尚未降临,但 22 岁至 25 岁年轻人在高暴露职业中的入职率,已经出现了肉眼可见的滑坡。
真实使用数据重新定义失业风险
过往研究预测技术对劳动力市场的冲击,总是缺乏足够的预见性与准确度。曾有权威学者宣称 25% 的美国工作极易受离岸外包冲击,十年过去那些岗位依然生机勃勃。政府机构的官方预测也仅仅依赖过去的线性趋势向外推演,极难捕捉突发的技术剧变。工业机器人或国际贸易到底带来了多少真实失业,学术界至今仍有激烈争论。

为避免重蹈覆辙,研究人员搭建了一个名为“观察到的暴露度”的全新测量框架。该工具专门用于精准捕获真实发生的职场技术替代行为,提前对高危职业发出预警。它就像一台高精度的雷达,彻底过滤掉那些虚假的技术恐吓,只记录真正落地的产业变化。
新框架巧妙融合了三个维度的核心数据集。它深度整合了涵盖大约 800 种美国特有职业具体任务的 O*NET(职业信息网络)数据库,并引入了记录百万真实交互的 Anthropic 自家经济指数。研究者同步吸纳了学界在 2023 年建立的任务暴露度估算标准,用以衡量大语言模型在理论上能否将某项任务的速度提升一倍以上。
前人研究给各项职场任务设定了明确评分,能被大语言模型完全接管的计为 1 分,需额外软件工具辅助的计为 0.5 分,毫无替代办法的计为 0 分。
理论上能做和现实中真正投入业务流程,完全是两码事。诸多工作理论上可由机器胜任,受限于严苛的法律约束、死板的软件门槛或必须的人工复核环节,其实际应用寥寥无几。以授权药房补充处方药为例,过往理论将其判定为完全可被 AI 提速,真实使用记录中却未见丝毫痕迹。
为了让测量结果极其贴近真实职场,研究者详细统计了真实的 Claude 使用情况并制作了图表。
下面图 1 展示了 Claude 使用量在理论任务暴露度上的分布。

清晰呈现了基于理论预测的任务实际使用情况分布。那些理论上大语言模型能独立胜任的高危任务,独自贡献了高达 68% 的真实使用量。被判定为毫无理论可行性的任务,仅仅只占了可怜的 3% 份额。
理论可行性与实际使用量高度正相关。97% 的真实业务应用准确落在理论可行范畴内,证实了学界过往判断大体无误。
为直观呈现现实应用与理论极限的差距,研究者按职业大类制作了一张对比雷达图,宛如给各大行业拍了一张探明机器渗透深浅的 X 光片。
下面图 2 展示了理论能力与观察到的暴露度在各个职业类别中的真实对比。

多数职业代表理论上限的蓝色区域异常饱满。计算机与数学类别有 94% 的任务具备理论渗透空间,办公与行政类也有高达 90% 的任务极易被 AI 加速。真实的红色覆盖率远远未达理论极限,计算机与数学领域的目前实际渗透率仅有 33%。伴随技术迭代与商业普及,中间那片未被填满的空白地带必将被逐步蚕食。
修剪树木等农业纯体力活或代表委托人出庭辩护等硬核法务工作,依然稳稳停留在机器的能力边界之外。
研究者依据多重指标排出了最高暴露职业榜单,找出那些正在被自动化替代的核心任务。
下表详细列出了受冲击最深的前十个职业,以及它们被 AI 大面积接管的具体工作内容。

位居榜首的计算机程序员日常任务被覆盖比例高达 74.5%。这与当前的软件开发场景完美吻合,海量代码编写与常规测试工作早已交由大模型批量处理。排在后面的客户服务代表和数据录入员同样处境凶险,繁杂的源文件阅读与系统录入正以前所未有的速度交由机器代劳。
大约 30% 的工作者依然拥有绝对的职业安全感。他们在观察库中的暴露度为零,相关任务在真实交互记录中出现频率极低。厨师、摩托车修理工、救生员、酒保、洗碗工和试衣间服务员都属于绝对安全的阵营,日常纯手工劳作毫无被虚拟代码替代的风险。
高暴露职业的真实画像与未来
明确了谁站在风暴中心,必须进一步厘清高暴露职业在劳动力市场上的宏观走向。BLS(美国劳工统计局)按惯例发布了 2024 到 2034 年的就业预估,研究者将这些官方预期与新测算出的真实暴露度进行了严谨比对。
测算结果呈现出非常微弱的负向关联。暴露度每增加 10 个百分点,官方给出的十年职业增长预期就会相应下降 0.6 个百分点。体制内分析师们凭借各自专业判断给出的预期结果,与真实使用记录推演出的结论基本同频共振。
下面图 4 的散点图非常直观地证实了该趋势。

图表中的每个圆点代表不同暴露度水平下的职业平均预期就业增长。随着暴露度向右侧攀升,整体就业增长预期呈现出缓慢下滑的下坠轨迹。收银员类本身就在萎缩的岗位处于左下角,而程序员和客服代表分别深陷右侧的高风险与低预期地带。
研究人员调取了 CPS(现期人口调查)在 ChatGPT 发布前三个月的详实数据,深度刻画被波及人群的真实轮廓。他们把暴露度排名前 25% 的打工人和毫无暴露风险的群体抽离出来,完成了一次极度细致的人口统计学对比。
高暴露群体与安全群体宛如来自两个截然不同的平行世界。高暴露人群中女性比例高出 15.5 个百分点,白人占比高出 10.6 个百分点,亚裔占比几乎翻倍。他们普遍拥有更体面的收入和更高的学历背景,平均时薪比安全群体高出 47%,且极少加入工会组织。
我们可以从下表的人口调查对比表格中看清更微观的底层差异。

无暴露群体中拥有研究生学历的人仅占 4.5%,最高暴露群体中这部分高知精英飙升至 17.4%。近四倍的悬殊比例彻底打破了以往机械化革命专挑低学历蓝领下手的客观规律,高薪知识型劳动者反倒成了被算法精确锁定的狩猎对象。
有了精确画像,研究者把最终焦点对准了职场最残酷的失业率指标。一个人失去工作急需寻找下家,最能直观体现技术剧变带来的经济创伤。研究人员利用人口调查的历史反馈,对最高危人群展开了极其严格的失业追踪。
下面图 6 完整展示了从 2016 年起两组人群失业率演变的历史轨迹。

上半部分红线标示高暴露群体,蓝线代表无暴露群体。新冠疫情大流行期间,从事线下实体服务且绝缘于新技术的无暴露群体承受了巨大的失业阵痛,失业率出现断崖式飙升。下半部分的双重差分模型完美印证了两者在后疫情时代的平稳并轨。
自 2022 年底 ChatGPT 横空出世以来,高暴露群体与安全群体的失业率鸿沟毫无波澜。两组数据的平均变动处于统计学上绝对可忽略不计的微小程度,高风险岗位的失业率仅仅泛起了一丝无法确认为技术导致的极小涟漪。
广大职场人总算可以暂时把心放回肚子里了。各种言之凿凿的白领大衰退根本没有发生,2007 到 2009 年大衰退期间整体失业率曾从 5% 翻倍至 10%。哪怕最高暴露群体的失业率仅仅从 3% 增加到 6%,极度敏锐的双重差分模型也能瞬间捕捉到波形震荡。大模型现有覆盖率仅仅在慢慢渗入部分环节,远未直接端走打工人的整个饭碗。
年轻人在高暴露职业中的求职困境
总体失业大盘看似稳如泰山,特定群体的底层水流却在急速改变方向。年轻人在极度内卷的劳动力市场中扮演着极度敏感的金丝雀角色,往往最先感知到行业氧气的稀薄。
相关学术报告发现,暴露度极高的职业里 22 岁到 25 岁年轻人的就业率已经呈现 6% 到 16% 的显著下跌。学者们将下跌的罪魁祸首直接指向了企业招聘端大幅缩水,而非简单粗暴的直接开除。很多刚踏入社会的职场新人还没来得及在官方统计中拥有固定职业头衔,普通失业率指标很难看清他们处境的恶化。没找到工作的新人往往选择继续深造或者黯然退出劳动力队伍,进而成为统计学里的隐形人。
研究者利用 CPS(现期人口调查)极其独特的面板追踪属性,直接统计年轻人拿到新录用通知的确切概率。他们逐月测算了有多少 22 岁到 25 岁的年轻人成功入职了一份以前没有的高暴露或低暴露新工作。
下面图 7 用极为清晰的走势描绘了年轻人冰火两重天的真实求职处境。

上半部分直观呈现了年轻人在两种职位上的月度入职比例变化,下半部分的模型计算精准测算了两条线拉开的残酷差距。彻底剔除掉前几年疫情造成的极端震荡干扰,这两条象征生机的入职曲线在 2024 年走向了无法掩盖的彻底背离。
绝缘于技术风暴的安全岗位对年轻人的吸纳率极其坚挺,每个月都能稳定接纳 2% 的新鲜血液。高暴露职位的大门正在向年轻求职者缓缓闭拢,整体入职比例生生跌去了大约 0.5 个百分点。步入后 ChatGPT 时代,高暴露职位接纳年轻人的成功入职率比 2022 年下降了整整 14%。
该求职阻力仅仅针对 25 岁以下的初级职场新人发挥威力,对那些年满 25 岁并在职场历练多年的老兵毫无杀伤力。企业在引入 API 全面接管初级编程、客户答疑或基础数据处理后,确实不再需要大批量招聘实习生来分担苦力。
自动化替代并未通过给老员工发放解雇信来完成,绝大部分是以无声冻结招聘的方式直接切断了新一代求职者的入场资格。那些被高薪行业拒之门外的年轻人,最终可能只能在边缘岗位徘徊。
极其冷静的数据给所有人敲响了警钟,机器并未立刻掠夺老兵的饭碗,却在悄无声息地吞噬职场新人的成长踏板。企业运用 AI 工具实现了人机协同提升了现存团队的产出上限,自然顺手掐断了新人入局的通道。
参考资料:
https://www.anthropic.com/research/labor-market-impacts