
最近几个月,国内关于AI基建过剩的讨论就没停过。万卡集群一个接一个地立项,可真在生产环境里跑着赚钱的应用有几个?没人说得清。同一时间,海外AI基础设施公司的股价每隔几个月就被“算力要过剩了”的论调锤一轮,然后又涨回去。
一个很自然的疑问:算力到底够不够?
Nebius的联合创始人Roman Chernin讲了一个故事。去年DeepSeek发布那天,Nebius股价一周跌掉40%。市场觉得推理突然不要钱了,谁还买算力。
同一周,Nebius创下了公司有史以来最好的销售记录。
推理变便宜了,以前跑不起的生产负载突然就敢上了。不是少买算力,是买更多。
1865年的蒸汽机,2025年的GPU
威廉·杰文斯1865年写《煤炭问题》的时候,观察到一件事。瓦特改良蒸汽机之后,英国的煤耗没有降,反而暴涨。效率越高,需求量越大。后来这个现象被叫做Jevons悖论。
AI 算力是目前能看到的最干净的Jevons悖论。每一次模型推理成本往下掉,用量弹上去的幅度都远超价格下降的幅度。Roman的原话是:“我们不是减少了消耗,我们是在增加消耗,同样预算能解决更复杂的问题了。”
他举了个例子:DeepSeek发布之后,Ktor这类做模型精调的公司最先受益。他们终于能把开源模型调好用在代码生成上,然后卖到生产环境。上游的Nebius跟着吃饱。
这件事的底层逻辑没那么玄。AI的生产负载不是固定的,是被算力价格压着的。价格每降一档,就释放一档需求。那些需求本来就在。企业知道这活AI能干,只是账算不过来。价格对上了,门就开了。
市场到现在还在犯同样的错。每次有更便宜的模型出来,AI基础设施公司的股价就要挨一刀。然后每次财报出来,数字都跟市场想的反着走。
钱帮不了你,水泥说了算
Roman在好几个地方反复提到时间。6个月,你有多少钱都没用,手上有什么就是什么,必须交付。12个月可以加速一些东西。18到24个月,钱才能真正转化成新产能。
这不是他系统论述出来的,是他从不同问题里反复回到的一个直觉。建数据中心要先锁电力协议、拿地、挖地基、铺光缆、等变压器,这些东西不听钱的指挥。
Gavin Baker之前说过一句话,Roman也引用了:如果今天给你钱建10倍的数据中心,你明天就能建好,这个行业马上就会过剩。审批和施工的延迟,恰好给需求增长留出了追赶的时间。
建一个数据中心,从签电力合同到机架上架,中间每一步的时间都是固定的,这是物理定律,不归资本管。
Nebius今年的资本支出是200到250亿美元。超大规模云是它们的8到10倍。钱多当然好,但钱多也不能让水泥干得更快。
你看,建数据中心不是网购,不能今天下单明天到货。他的对手有10倍的钱,一样得等水泥干。所以钱多没用,快不了。但也正因为快不了,这个行业才没有在需求真正起来之前先把自己撑死。建得慢,反而救了它。
前两年中国互联网讨论过一件事,为什么烧钱换规模的模式几乎全失败了。补贴停了用户就走,因为补贴没有创造新的使用场景。算力降价不一样。每次降价都释放一批真正有需求、只是被价格挡在门外的生产负载。需求不是补贴出来的,是本来就在那等着。
90%在闭源,然后慢慢往开源发展
Roman讲了一个客户的故事。Revolut刚开始做AI的时候,99%的推理预算都花在OpenAI上。等他们把一两个场景跑通了,发现有些用例的账算不过来。给客服用的模型不需要最强,但量太大,用闭源太贵。
他们开始往开源模型迁。但这件事没想象中快,因为最先卡住他们的不是模型质量,是评估体系。你怎么知道换了模型之后,客服回答没有变差?你得先建一套自动评估的框架,把你关心的指标钉死。然后才能放心地换模型、精调、再换模型。
Roman管这个叫基础性投资。企业要先花时间把评估体系、自动化流水线、模型切换机制建好。这个阶段看起来慢,好像没在增长。一旦建好,AI预算的增速会追上AI Native公司。
他说Revolut现在的AI预算增长曲线,跟Cursor、Cognition这类公司是一样陡的。
什么叫建评估体系?不是找几个人试用一下新模型给个反馈。是你得先定义清楚好到底是什么意思。客服回答的准确率怎么量化、延迟能不能超过200毫秒、换了模型之后用户留存有没有掉。这些指标变成可自动跑的测试,模型每次更新,评估流水线自动跑一遍,出一张报告。没这个东西,你不敢动。
这跟软件工程的自动化流水线一模一样。只是现在测的不是代码逻辑,是模型行为。代码不会因为你换了GPU就给出不同的输出,但是模型会。
Roman说大部分企业现在的状态是清楚的。它们从外面看好像没怎么用AI,实际上是在底下搭这套评估和切换的基础设施。搭好了,后面换模型的速度会非常快。
AI在企业里落地,真正的瓶颈既不是模型不够聪明,也不是算力太贵。是内部那套工程基础设施没搭好。建完这条模型流水线之前,你有再多钱也只能用最贵的闭源API。建完之后,你才开始真正省钱。
Roman是卖算力的人,他当然会说需求永远在。万一有些场景价格再低也找不到足够的需求,万一企业内部消化能力跟不上算力降价的速度,买更多的逻辑就会撞墙。不过至少目前,Revolut、Shopify这些公司的预算曲线还没有平稳的迹象。
关于AI基建的更多深度讨论,欢迎访问云栈社区。