昨天,智谱AI公布了2025年全年业绩,这是其上市后的首份财报。全年实现收入7.24亿元,同比增长131.9%;但在高达31.8亿元的研发投入影响下,经调整净亏损达到31.82亿元。
虽然亏损额度巨大,但市场的反馈却异常积极,财报发布后其股价单日上涨了31.8%。其中一个关键因素在于,其API服务收入呈现出爆发式增长,这让市场看到了一条清晰的商业化路径。
2025年,智谱的云端部署(即API服务)收入从2024年的0.48亿元猛增至1.9亿元,同比增长高达296%,收入占比也从15.5%提升至26.3%。管理层在电话会议中透露,当前API服务的年度经常性收入(ARR)约为2.5亿美元,并预计年底可以达到10亿美元。
这并非孤例。纵观行业,API调用量普遍上升,Token正成为最直接的计费单元,预示着API正成为大模型公司最核心的变现路径之一。
基模增长,靠卖API
在智谱的这份财报中,最值得关注的变化是收入结构的迁移。云端部署,已经成为最核心的增长来源。API收入的增长,其底层逻辑是调用量的增长,而这背后离不开智能体(Agent)技术的推动。
当Agent开始自动执行长程任务时,一次需求往往对应多轮调用,Token消耗被成倍放大,API调用量随之水涨船高。行业正形成一个共识:当大模型具备长程任务执行能力后,调用不再停留于单次问答,而演化为一个持续运行的系统化过程。在这种结构下,Token本身成为了最直接、最确定的计费单位。换句话说,当模型能力足够强时,API本身就会收敛为大模型最清晰的商业模式。
这一趋势正成为头部厂商的共同选择。海外市场走得更早,例如Anthropic约80%的收入来自企业级API调用服务。国内主流基座模型公司,如智谱AI、MiniMax、月之暗面,其核心收入也正快速向API调用收敛,MaaS(Model as a Service)成为承接增长的主要路径。
智谱计划未来更加侧重标准化的API服务。到2026年,API服务与本地化部署预计各占一半;未来2-3年,重心将进一步向API倾斜。
类似的变化也正在MiniMax身上发生。2025年,其开放平台与企业服务收入达到2596.3万美元,同比增长197.8%,收入占比提升至32.8%。截至2026年2月,公司ARR已突破1.5亿美元,实现翻倍增长,核心驱动力同样来自Token消耗的提升,尤其是编码助手与Agent场景的放量。高盛预计,2026年MiniMax来自开放平台(API)的收入占比将达到约40%。
大模型商业模式的收拢,意味着价值衡量方式也变得清晰:正从“能力指标”转向“Token计量”。
路线分化背后,两种解题思路
随着AI进入规模化应用阶段,一个问题变得具体:当模型能力逐渐收敛,大模型公司的核心竞争力究竟是什么?对此,智谱和MiniMax给出了两种不同的解法。
智谱的逻辑是追求极致的模型上限。公司提出了TAC(Token Architecture Capability)概念,其核心判断是:智能的质量,决定定价权。智谱认为,随着Agent的演进,Token也会分层,低复杂度、标准化的token将走向低价甚至免费,只有高复杂度、高可靠性的高质量token才具备持续定价权。
这一点在数据上已有所体现。一季度,智谱API定价提升83%,但需求并未收缩,反而呈现供不应求,调用量增长达400%。
如果说智谱讲的是“质量决定定价权”,那么MiniMax的逻辑则侧重于“路径差异化”和“效率”。MiniMax选择了一条并不主流的全模态自研路线,并行推进文本、视频、语音、音乐四大模态。这条路线的核心不在于“多”,而在于“广”,旨在通过多模态交互降低使用门槛,从而将用户群体扩展到更广泛的人群,在不显著降低智能密度的前提下,放大Token吞吐量。
再看效率。MiniMax的另一条主线是极致的资源利用效率。2025年,公司研发投入2.53亿美元,同比增长33.8%,明显低于158.9%的营收增速。经营数据显示,智谱每获得1元收入,对应约4.4元亏损;MiniMax则为3.2元。人效上,智谱约66万元,而MiniMax达到126万元。
当然,部分差异源于商业模式,MiniMax更多依赖产品收入,而智谱仍以本地化部署为主。但两条路径的分化依然清晰:一边追求“智能上限”,通过提升能力获取定价权;另一边优化“效率与覆盖”,通过扩大使用规模来放大Token吞吐量。这本质上是同一商业公式下的两种不同解法。
寡头格局,才是基模生意的最大确定性
抛开短期估值波动,大模型这门生意的轮廓正逐渐清晰。它与传统软件不同,成本呈台阶式上升,收入却未必同步变厚,反而可能在激烈竞争中被压缩。这种“先天偏脆弱”的结构,却天然指向另一个结果:行业会走向寡头。
因为只有极少数公司能够持续承受这种级别的巨额投入。商业形态上,它更像晶圆厂,前期投入巨大,但一旦卡位成功,竞争者极少,而市场蛋糕又足够大。
同时,大模型市场并非完全“赢家通吃”,更接近一个分层市场。最顶层的模型,哪怕仅有细微的效果优势,在编码等复杂场景下也能被放大为显著溢价。但并非所有任务都需要最强模型,市场会自然分层:顶层吃溢价,中层跑规模,底层承接长尾需求。
在这个过程中,效率成为关键变量。由于缺乏网络效应,用户切换成本极低。这意味着,只要有公司能做出一个“90分”的模型,同时价格更具竞争力,就可以迅速放量。价格的背后本质是成本,这不仅取决于技术,还包括算力、电力等一系列成本。通过工程优化、规模化部署以及更低的电力成本,可以显著压低推理成本,这使得部分模型厂商的出海,本质上是在做一门“Token差价”的生意。
不过,对于国内大模型公司的商业前景,也不能过于乐观。中美市场环境存在差异:美国生态更依赖开发者长尾需求,企业更愿为能力付费;而国内调用更集中在头部客户,加上供给端竞争激烈,Token的溢价能力可能不会长期存在。某种程度上,在美国,基模更接近软件与平台的结合体,而在中国则更像基础设施的一部分。
因此,国内大模型公司的商业模型最终能跑到什么高度,或许还需要更多时间来观察和验证。欢迎对AI商业化路径感兴趣的开发者,到云栈社区的相应板块继续探讨。