2025年下半年到2026年初,各家大模型还在竞相补贴用户,API价格一降再降,免费额度也一个比一个大。然而仅仅过了三四个月,风向就完全变了。从3月到4月,智谱接连开放了两次退款通道,阿里百炼这两天更是直接砍掉了入门级的Lite套餐,最低使用门槛从几十元跳涨到200元每月。近期其他平台也有VIP套VIP、额度调整等操作。这看起来并非个别公司的孤立决策,而是一次全行业的集体转向。那个可以轻松“薅羊毛”的阶段已经结束,算力紧张期正式到来。
一周之内,到底发生了什么
这波操作不是单独的一个事件,而是密集的行业共振。
1.1 智谱GLM:两次退款 + 三次提价


智谱的操作最能说明问题,短时间内开启两次退款通道,意味着什么?说明连他们自己都没想到市场需求会如此猛烈,现有的算力储备已经严重不足。与此同时,Coding Plan与API价格同步调整,年内三次提价,海外版最高涨幅达140%。涨到了什么程度?智谱海外Pro版月费已高达72美元,逼近Claude Pro的100美元,要知道半年前它只需要30美元。
1.2 阿里百炼:Lite套餐说砍就砍

阿里百炼的调整时间线非常明确:
- 3月20日00:00:Lite套餐停止新购。
- 4月13日18:00:Lite套餐停止续费与升级。
也就是说,之前使用Lite套餐的用户,在4月13日后只有两个选择:要么升级到每月200元、提供9万次请求额度的Pro套餐,要么另寻他路。值得注意的是,像 qwen3.6-plus 这样的高性能模型被设定为 Pro套餐专属权益。这标志着不仅最低消费门槛被大幅提高,部分优质模型的访问权限也被收窄到了高阶套餐。
1.3 即梦:组合式调整
即梦近期的新闻也不少,其文生视频模型 seedance2.0 单次生成消耗的Token或积分暴涨。此外还包括折扣缩水(首年优惠从5折变为6折)、积分大幅缩水。有AI短剧从业者算了一笔账:一条60秒的短剧大约需要40-50个镜头,按照新的消耗标准计算,仅视频生成成本就上涨了5到8倍。
为什么突然一起涨价
你可能想问:这些公司是不是约好了?虽然没有明面上的约定,但他们确实面临着相同且紧迫的问题。
2.1 Agent时代来临,Token消耗量爆炸
这或许是最根本的驱动力。在Chatbot时代,一次对话消耗几千个Token就足够了。但进入Agent时代呢?特别是年后AI编程助手等工具爆发式增长,一个智能体要完成一项复杂任务,需要反复调用上下文、执行工具链路,单个任务消耗的Token量轻松增长数倍。来看两组数据:
- 中国日均Token调用量已突破140万亿(国家数据局数据)。
- 字节跳动:从2025年12月的63万亿增长至2026年3月的120万亿,三个月内几乎翻倍。
这清晰地表明,需求端的增长不是线性的,而是指数级的。
2.2 算力供应链持续吃紧
从核心的AI芯片到高速内存,硬件成本都在上涨。虽然各大模型厂商都在深度适配国产服务器以寻求替代,但整体成本压力依然普遍存在。
2.3 商业逻辑的根本性转变
过去的策略是 “补贴获客,低价换量” 。各家公司拼命降价、推出超低门槛套餐,核心目标只有一个:先圈住用户和市场。但现在,行业显然进入了一个新阶段:筛选客户。无论是取消低价套餐、收缩权限还是提高价格,本质上都是在做同一件事:淘汰免费或低质量调用用户,锁定那些愿意为高质量Agent能力付费的企业级(B端)客户。
他们之所以敢于这么做,是因为市场付费意愿已经得到充分验证。
对个人与开发者意味着什么
预计后续国内其他云平台厂商也会跟进调整,包括腾讯云、火山引擎等。对于广大开发者和中小团队而言,最直接的冲击就是开发与运营成本急剧上升。
以智谱为例,年内三次提价叠加,API调用成本的累计涨幅接近100%。原来一个月1000元预算够用的场景,现在可能需要2000元。这迫使我们必须紧急寻找替代模型或调整Coding Plan的使用策略。
基于当前信息,这波涨价潮可能远未结束。一个简单的理由是:现阶段正值国内外新模型密集发布的窗口期(包括GPT-6、Claude新一代等)。每一次重磅新模型的发布,都会带来新一轮的算力需求激增。供需之间的缺口短期内恐怕只会扩大,而非缩小。
那么,现阶段还有哪些性价比较高的Coding Plan选择?GitHub Copilot Pro(10美元/月,首月免费)和Cursor Pro(20美元/月)目前相对稳定,仍是值得考虑的选项。
此外,这也促使我们重新思考应用架构。对于正在开发Agent应用的团队来说,面对大模型成本上涨,做好模型路由策略至关重要(简单任务调用便宜的小模型,复杂任务才启用旗舰模型)。同理,是否可以考虑引入语义缓存机制,毕竟不是所有用户请求都需要实时调用大模型。未来,市场上很可能会涌现出更多创新的架构设计方案,来应对这一轮成本挑战。
最后,虽然“羊毛”阶段可能真的结束了,但对于那些能够真正利用AI创造价值的开发者和企业来说,这未必全是坏事。竞争环境将变得更公平,服务质量有望因资源集中而提升,留下来的都是愿意为其正价值付费的客户。关于如何在云栈社区等平台上与同行交流更多降本增效的实战技巧,也是一个值得探索的方向。