WSJ 发了一条消息:OpenAI 正在考虑大幅下调部分 AI 服务价格,以应对和 Anthropic 之间越来越激烈的用户竞争。

表面看,这是一个价格战新闻。
但如果只把它理解成 OpenAI 和 Anthropic 抢用户,可能就低估了这件事的意义。它背后真正反映的是,AI 行业正在从“模型能力竞争”,进入“使用成本竞争”。
过去两年,AI 行业最重要的问题是:谁的模型更强?
现在,问题开始变成:谁能用更低的成本,完成同样复杂的任务?
这个变化,可能会影响接下来整个 AI 产业链的定价方式、商业模式和基础设施需求。
AI 不是没人用,而是用得太贵了
OpenAI 考虑降价,并不是因为 AI 需求不行。恰恰相反,很多企业现在的问题是:AI 太好用了,也太容易被用爆了。
一个员工平时用 AI 写代码、做分析、整理资料、生成方案,可能并不会明显感受到成本。因为企业买了账号,或者统一采购了 API,个人使用的时候不会每次都想“这次调用花了多少钱”。
站在公司层面,成本是真实存在的。而且据笔者了解到的,国内某大公司,如果员工某天的 token 用的太多,也会收到邮件,让他知道自己今天花了多少钱的 token。说明对公司来说,token 已经是一笔不小的开支了。
尤其是 AI 从简单问答走向 Agent 之后,单次任务的消耗会明显上升。过去一次对话可能只是几轮问答,现在一个 Agent 要读取上下文、拆解任务、调用工具、检查结果、修改错误,再继续执行下一步。
这已经不是简单的“生成一段文字”,而是在模拟一段工作流。
所以 AI 的成本问题,并不是用户不愿意用,而是用得越深入,账单越容易失控。
这也是为什么企业开始越来越关注 token budget、使用上限和 ROI。AI 早期的“惊艳感”还在,但企业不能一直只为惊艳买单。到最后,所有技术都要回到一个问题:它到底帮公司省了多少钱,或者多赚了多少钱?
模型降价,本质上是争夺工作流入口
OpenAI 如果真的大幅降价,短期看会压低 API 单价,但它想换来的东西很清楚:更多用户、更高使用频次,以及更深的工作流绑定。
这不是普通的促销。
AI 模型和传统软件不太一样。传统软件用户买了之后,使用成本相对稳定。但 AI 是用量型产品,用户每多跑一个任务、每多生成一次结果,背后都有推理成本。
所以,AI 公司最理想的状态不是用户偶尔打开一次,而是把模型嵌进日常工作流里。
比如写代码、查资料、写内部报告、做数据分析。只要这些工作流形成习惯,用户迁移成本就会变高。
这也是 OpenAI 和 Anthropic 竞争最激烈的地方。
Anthropic 的 Claude Code 在开发者群体中存在感很强,OpenAI 也在强化 Codex。表面看,这是两个 coding 产品的竞争;更深一层看,这是开发者入口的竞争。
谁能进入开发者每天的工作流,谁就不仅仅是在卖模型,而是在占据未来 AI Agent 的操作界面。
真正重要的不是 token 单价,而是任务成本
讨论 AI 价格时,很多人会看“每百万 token 多少钱”。这个指标有用,但并不完整。
用户真正关心的不是 token 单价,而是完成一个任务到底要花多少钱。
两个模型的标价可能接近,但如果一个模型完成任务需要 100 万 token,另一个需要 400 万 token,那么后者即使单价不贵,实际任务成本也可能高很多。
这就是 AI 定价接下来会变复杂的地方。
未来竞争可能不再只是输入 token、输出 token 的价格表,而会变成几个维度的综合竞争:
- 模型够不够强
- 完成任务需要多少轮
- 上下文管理是否高效
- 能不能减少无效推理
- 工具调用是否稳定
- 同样预算下能完成多少工作
换句话说,AI 行业会从“模型能力排行榜”,逐步走向“单位任务经济性排行榜”。
谁能用更少 token、更短时间、更低成本完成同样任务,谁就更有商业化优势。
AI 商业模式会从“卖 token”走向“卖结果”
现在很多 AI 服务还是按 token 收费,或者按月订阅收费。但这可能只是过渡阶段。
因为企业最终不是为了买 token,而是为了买结果。
企业不会天然关心某个任务消耗了多少 token,它关心的是:这个 Agent 是否替代了人工?是否缩短了研发周期?是否提高了客服转化率?是否减少了销售跟进成本?是否让一个团队能做过去两倍的事情?
所以长期看,AI 的收费方式可能会从“按调用量收费”,逐渐走向“按任务、按席位、按结果、按 SLA、按企业合同”收费。这本质上是在为最终的业务价值定价,而非算力消耗。
这有点像云计算早期。
一开始大家关心 CPU、存储、带宽价格;后来企业更关心完整解决方案、稳定性、安全性和业务价值。
AI 也会经历类似过程。随着行业成熟,尤其是在云原生和 Serverless 架构的普及下,AI 服务也将走向更细粒度的价值交付。
基础 token 可能越来越便宜,但高价值任务未必会便宜。尤其是 Coding、Agent、企业自动化、行业专用模型这些场景,真正的价格锚不是 token,而是它替代了多少人力和创造了多少业务价值。
AI 行业正在进入“成本效率”时代
过去两年,AI 行业的主线是能力突破。
谁的模型更聪明,谁的上下文更长,谁的 benchmark 更好,谁就能获得更多关注。
但接下来,行业会越来越关注成本效率。
模型厂商要优化推理成本,云厂商要提高算力利用率,企业客户要控制 AI 预算,应用公司要证明 ROI,开发者要比较不同模型完成同一任务的成本。
这会让 AI 行业出现一个很重要的分化:
- 中低端模型调用会越来越便宜,因为开源模型、硬件进步和竞争会持续压低价格
- 高端模型仍然有定价权,因为复杂任务、长上下文和高可靠性仍然稀缺
- 任务型 Agent 可能反而更贵,因为它卖的不是 token,而是工作结果
所以,AI 不会简单进入全面通缩。
更准确地说,是基础能力通缩,高价值任务通胀。
这种趋势也将在技术社区引起广泛讨论。例如在云栈社区,开发者们早已开始关注模型选型时的性价比和长期维护成本,这正成为技术决策中的核心考量。
星球每天的早报(周内早上9点前更新),除了路透、彭博、FT、Information这些新闻的内容总结,还有汇总了国内外分析师的观点,覆盖的产业包括:Memory、智驾/Physical AI、机器人、AI算力、AI电力、光、PCB、液冷、AI应用,内容比较全,都是最新的分析师观点和新闻,欢迎大家进星球查看。
半导体AI产业交流
对半导体和AI产业交流,可以加下面微信,请备注姓名和所在行业。