找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2952

积分

0

好友

400

主题
发表于 2 小时前 | 查看: 3| 回复: 0

刚进入4月,Anthropic的年度经常性收入(ARR)就超过了OpenAI。这比预期还要早上几个月。种种迹象显示,这场收入竞赛的逆转,不仅仅是数字上的超越,更可能是AI市场重心与企业级定价逻辑发生偏移的明确信号。

市场对此早有预期。不过,Anthropic CEO阿莫迪(Dario Amodei)此前在算力部署上的相对保守,一度引发外界对其收入增长受限的担忧。近期,服务器不稳定与用户限流减速也印证这都是事实。

这次,Anthropic在宣布与谷歌、博通达成3.5GW下一代TPU算力集群的同时,披露了它的ARR突破了300亿美元。截至2月底,OpenAI的ARR约为250亿美元。

全球大模型厂商ARR增长趋势

ARR的局限与超越

严谨地看,两家公司ARR无法直接横向对比。媒体曾披露过,两家公司对收入确认的会计原则并不一致,这或许也影响到了ARR统计口径的不同。

具体而言,OpenAI的模式是净额法,微软卖OpenAI的模型给Azure客户,OpenAI拿走销售额的20%,也只把那20%的分成,记作自己的收入。不过,目前尚不清楚OpenAI将如何核算其通过亚马逊网络服务(AWS)产生的收入,这是两家公司之间新协议的一部分。

而Anthropic的模式是总额法,AWS、微软、谷歌转售Claude模型,把100%的销售额全部记作自己的收入,然后给云厂商的那部分分成,记作“销售和营销费用”。

不过,尽管口径存在差异,纵向对比的增速分化,仍提供了一个值得关注的信号。过去三年间,Anthropic几乎每年接近10倍的增长,明显快于OpenAI约3倍的扩张。这一差异可能对应着其所覆盖的交易规模处于更陡峭的扩张区间。某种程度上,这也与当前企业侧对token调用的需求增长,快于消费侧的结构性特征相呼应。

2023年10月,Anthropic的ARR约为1亿美元;14个月后,攀升至10亿美元;到了去年底,这个数字已经进一步升至90亿美元。到了2026年,1年10倍的速度,没有放缓的迹象。2月达到140亿美元,3月升至190亿美元,如今最新数字达到了300亿美元。

反观OpenAI,它的ARR增速约为1年3倍。从2023年到2025年,公司ARR从20亿美元增长为超过200亿美元。到了今年,两个月时间里ARR增长了约25%,至250亿美元,仍未逃离一年三倍的引力束缚。

如果将过去几年的增长斜率机械外推,在不考虑算力约束、价格变化与客户结构调整的理想情形下,到年底超级IPO窗口期,Anthropic的ARR或将逼近1000亿美元,而OpenAI则在600亿美元左右。

届时,资本市场的关注重心,可能更多转向增长斜率更陡的一方。事实上,二级市场已经率先完成重估,6亿美元的OpenAI股份缺乏承接,Anthropic却遭到疯抢。也正因如此,关于IPO节奏的取舍,可能变得更加敏感。OpenAI内部传出其CFO与CEO奥特曼在IPO的意见上出现了分歧,前者主张延后,后者坚持要在10月,抢在Anthropic前头。

算力约束正是此次Anthropic与谷歌合作所要解决的。客户结构调整也在潜移默化发生。美国战争部给它扣上一顶“供应链风险”大帽子后,不少订阅用户从OpenAI转向了Anthropic。

token经济学的变轨

价格当然也会变化。但它会逐步向更适配企业使用结构的定价方式倾斜。年初以来,黄仁勋从算力与产出关系的角度重述了token的价值,而Claude Code则通过建立模型、harness与技术的框架,将token从单纯的计量单位,推向更接近流程与控制的资源。

在黄仁勋的框架下,推理的token经济学,是一条吞吐量(Throughput,TPS/兆瓦)与交互性(Interactivity,TPS/用户)之间展开的价值曲线。前者往往对应消费市场的大规模生成场景。一次调用往往对应一轮问答,token成本与输出长度大体挂钩,因此吞吐量越高,单位价格越低,也就越具优势。

当token经济学向低延迟倾斜,中国开源生态短板浮现

2026/03/18 完整阅读 >

后者则适用于那些对延迟极为敏感的高经济价值场景。当AI可以替代人类完成数小时甚至数天的编程工作,执行速度本身就成为价值的一部分;当多个智能体协同完成复杂流程时,延迟更是直接约束系统可用性。在这种情况下,响应速度开始成为决定token价值的关键变量。

而另一方面,在Claude Code逐步渗透的白领工作场景中,token越来越多地承担系统控制的角色,其成本取决于是否触发特定能力边界。一个智能体系统为了得到可靠结果,往往需要经历多轮规划、执行、测试与回退,其代价体现为额外的调度复杂性、token开销与延迟累积,从而显著推高总体消耗。

这也意味着,token经济学正在从“线性计价”走向“边界驱动的非线性计价”。

OpenAI也在进入这一领域。在迅速调整战略方向后,目前,OpenAI面向企业的收入显著提升,营收占比达到40%,预计年底与消费者业务持平。其中,Codex的周活跃用户超过200万,过去三个月增长了5倍。

但相比之下,Claude Code已经通过harness快速迭代,构建起一套更具黏性的系统能力。从功能到结构层面,每周都会引入新的钩子(hook,本质上是工作流中的可插入控制点)、技能系统、工作树以及MCP集成,使模型不再只是调用工具,而是逐步嵌入到完整的工作流之中。因此,行业竞争的焦点,正在从模型能力本身,转向谁能更早锁定用户的工作流与控制权。

Harness正在如何改变token经济学

2026/03/31 完整阅读 >

更关键的是,下游企业仍然受到成本约束,需要在这套不断演化的智能体系统中,以更少的“控制token”去约束更大规模的“生成token”,以避免无效计算的浪费。换言之,token不再只是被动消耗的资源,而是需要被精细调度的控制变量。

与此同时,整个智能体系统中,模型与harness层之间的边界也在不断移动。当模型内生地吸收某些能力时,原本用于补偿模型能力的harness组件,便会从“必要投资”转变为“额外负担”,并最终被系统内部替换或消解。

这也意味着,token经济学更像一张随模型能力移动的边际收益曲线。在这一转变过程中,Anthropic显然更早地完成了对这一结构的押注与布局。

当工具的演进速度超过用户的学习速度时,迁移本身就变得困难;而一旦整个工作流程围绕Claude Code所定义的token使用方式构建,企业客户所绑定的,就不再只是工具本身,而是其对应的边际收益曲线。

今年2月,Anthropic拥有500家年消费额超过100万美元的企业客户,一个多月时间后,已经翻倍至超1000家。14个月前,Claude Code甚至尚未推出,而今天,其相关业务已达到约25亿美元的ARR。

销售AI,还是定义下一代基础设施

Anthropic还在加码,与多家私募股权机构合作,成立一家新公司,旨在向其投资组合公司销售智能体系统。本质上,这是在对外复制一套关于token如何被使用、被约束,并最终转化为生产力的方式。

当前,Anthropic的局部领先,本质上建立在对新一代AI智能体网络基础设施的重构之上。当AI智能体开始成为“下一代网络”中的主要参与者,token的生成、调度与定价方式,也随之脱离了传统互联网以流量和订阅为核心的计费逻辑,原有的互联网基础设施也将部分失去适用性。

这一点在其对OpenClaw的限制中体现得尤为明显。Claude的订阅体系面向的是人类用户;如果是内部智能体,额外消耗姑且还能在其自身harness所定义的边际收益曲线中被吸收与优化;而OpenClaw则代表一种不受其控制的“外部智能体调用”,其token消耗无法被纳入既定的调度与定价体系之中。上周 Claude Code 的意外开源,某种程度上放大了这种“外部调用”的潜在规模。

这一切,正如小米模型负责人罗福莉所言,真正的出路,并非更便宜的token,而是模型与harness的协同进化。只不过,Anthropic已经率先定义了这套规则,并由此定义了token如何被使用,以及价值在何处生成。

对于想深入了解AI产业动态与技术演进的开发者,欢迎在 云栈社区 分享你的见解。




上一篇:具身智能赛道火热:千寻智能获投30亿元,雷军顺为资本与马云云锋基金联手押注
下一篇:Arch Linux 2026.04.01 发布:集成Linux 6.19内核,安装器体验升级
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-4-8 10:35 , Processed in 0.706215 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表