找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

5110

积分

0

好友

708

主题
发表于 昨天 21:49 | 查看: 3| 回复: 0

2025年下半年到2026年初,各家大模型还在竞相补贴用户,API价格一降再降,免费额度也一个比一个大。然而仅仅过了三四个月,风向就完全变了。从3月到4月,智谱接连开放了两次退款通道,阿里百炼这两天更是直接砍掉了入门级的Lite套餐,最低使用门槛从几十元跳涨到200元每月。近期其他平台也有VIP套VIP、额度调整等操作。这看起来并非个别公司的孤立决策,而是一次全行业的集体转向。那个可以轻松“薅羊毛”的阶段已经结束,算力紧张期正式到来。

一周之内,到底发生了什么

这波操作不是单独的一个事件,而是密集的行业共振。

1.1 智谱GLM:两次退款 + 三次提价

GLM Coding Plan限时退款申请说明

智谱AI订阅服务价格对比图

智谱的操作最能说明问题,短时间内开启两次退款通道,意味着什么?说明连他们自己都没想到市场需求会如此猛烈,现有的算力储备已经严重不足。与此同时,Coding Plan与API价格同步调整,年内三次提价,海外版最高涨幅达140%。涨到了什么程度?智谱海外Pro版月费已高达72美元,逼近Claude Pro的100美元,要知道半年前它只需要30美元。

1.2 阿里百炼:Lite套餐说砍就砍

阿里百炼Coding Plan套餐详情页面截图

阿里百炼的调整时间线非常明确:

  1. 3月20日00:00:Lite套餐停止新购。
  2. 4月13日18:00:Lite套餐停止续费与升级。

也就是说,之前使用Lite套餐的用户,在4月13日后只有两个选择:要么升级到每月200元、提供9万次请求额度的Pro套餐,要么另寻他路。值得注意的是,像 qwen3.6-plus 这样的高性能模型被设定为 Pro套餐专属权益。这标志着不仅最低消费门槛被大幅提高,部分优质模型的访问权限也被收窄到了高阶套餐

1.3 即梦:组合式调整

即梦近期的新闻也不少,其文生视频模型 seedance2.0 单次生成消耗的Token或积分暴涨。此外还包括折扣缩水(首年优惠从5折变为6折)、积分大幅缩水。有AI短剧从业者算了一笔账:一条60秒的短剧大约需要40-50个镜头,按照新的消耗标准计算,仅视频生成成本就上涨了5到8倍

为什么突然一起涨价

你可能想问:这些公司是不是约好了?虽然没有明面上的约定,但他们确实面临着相同且紧迫的问题。

2.1 Agent时代来临,Token消耗量爆炸

这或许是最根本的驱动力。在Chatbot时代,一次对话消耗几千个Token就足够了。但进入Agent时代呢?特别是年后AI编程助手等工具爆发式增长,一个智能体要完成一项复杂任务,需要反复调用上下文、执行工具链路,单个任务消耗的Token量轻松增长数倍。来看两组数据:

  1. 中国日均Token调用量已突破140万亿(国家数据局数据)。
  2. 字节跳动:从2025年12月的63万亿增长至2026年3月的120万亿三个月内几乎翻倍

这清晰地表明,需求端的增长不是线性的,而是指数级的

2.2 算力供应链持续吃紧

从核心的AI芯片到高速内存,硬件成本都在上涨。虽然各大模型厂商都在深度适配国产服务器以寻求替代,但整体成本压力依然普遍存在。

2.3 商业逻辑的根本性转变

过去的策略是 “补贴获客,低价换量” 。各家公司拼命降价、推出超低门槛套餐,核心目标只有一个:先圈住用户和市场。但现在,行业显然进入了一个新阶段:筛选客户。无论是取消低价套餐、收缩权限还是提高价格,本质上都是在做同一件事:淘汰免费或低质量调用用户,锁定那些愿意为高质量Agent能力付费的企业级(B端)客户
他们之所以敢于这么做,是因为市场付费意愿已经得到充分验证

对个人与开发者意味着什么

预计后续国内其他云平台厂商也会跟进调整,包括腾讯云、火山引擎等。对于广大开发者和中小团队而言,最直接的冲击就是开发与运营成本急剧上升

以智谱为例,年内三次提价叠加,API调用成本的累计涨幅接近100%。原来一个月1000元预算够用的场景,现在可能需要2000元。这迫使我们必须紧急寻找替代模型或调整Coding Plan的使用策略。

基于当前信息,这波涨价潮可能远未结束。一个简单的理由是:现阶段正值国内外新模型密集发布的窗口期(包括GPT-6、Claude新一代等)。每一次重磅新模型的发布,都会带来新一轮的算力需求激增。供需之间的缺口短期内恐怕只会扩大,而非缩小。

那么,现阶段还有哪些性价比较高的Coding Plan选择?GitHub Copilot Pro(10美元/月,首月免费)和Cursor Pro(20美元/月)目前相对稳定,仍是值得考虑的选项。

此外,这也促使我们重新思考应用架构。对于正在开发Agent应用的团队来说,面对大模型成本上涨,做好模型路由策略至关重要(简单任务调用便宜的小模型,复杂任务才启用旗舰模型)。同理,是否可以考虑引入语义缓存机制,毕竟不是所有用户请求都需要实时调用大模型。未来,市场上很可能会涌现出更多创新的架构设计方案,来应对这一轮成本挑战。

最后,虽然“羊毛”阶段可能真的结束了,但对于那些能够真正利用AI创造价值的开发者和企业来说,这未必全是坏事。竞争环境将变得更公平,服务质量有望因资源集中而提升,留下来的都是愿意为其正价值付费的客户。关于如何在云栈社区等平台上与同行交流更多降本增效的实战技巧,也是一个值得探索的方向。




上一篇:开源AI代理陷抄袭风波:Hermes Agent与Evolver架构设计相似性深度解析
下一篇:灵敏度、链路预算、传播模型计算精讲:一道GSM手机参数求解题
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-4-17 02:20 , Processed in 1.106360 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表