最近三个月,科技圈似乎都在屏息等待一个消息的最终确认。
DeepSeek V4。
它的发布时间线可谓一波三折:从春节推迟到三月,又从三月跳票到四月。期间,团队甚至经历了一场长达13个小时的宕机事件,引发了外界的诸多猜测。
但就在近日,从GPU供应链端传来了一个不同寻常的信号。据称,阿里、腾讯、字节等国内科技巨头,正在加大力度采购华为昇腾、寒武纪思元等国产AI芯片,这一波集中采购甚至直接带动了相关芯片的价格上涨了约20%。
一个值得思考的问题是:这些以往非英伟达高端显卡不买的大厂,为何突然开始争相抢购国产AI芯片?
一个合理的推断是:DeepSeek V4很可能已经成功跑通了。
长久以来,中国AI产业存在一个明显的短板——核心算力受制于人。我们在算法层面可以追赶甚至并驾齐驱,数据资源也相当丰富,但最底层的计算引擎,却被英伟达的硬件牢牢卡住了脖子。如果无法获取最顶级的计算芯片,那么中国的大模型发展,可能永远只能扮演一个跟随者的角色。
然而,DeepSeek V4或许正在用一种极其硬核的方式,试图解开这个死结。
它的解法,在历史上似曾相识:“两弹一星”模式。
回顾当年中美苏的核竞赛,美国走的是财大气粗、资源堆砌的路线,苏联则是典型的“力大砖飞”。而当时一穷二白的中国呢?我们没有大型计算机,老一辈科学家们硬是靠算盘和纸笔,秉承着 “硬件不够,人力来补;算力不够,算法来凑” 的信念,生生蹚出了一条独特的“于敏构型”氢弹之路。这条路径不仅成功了,其成本和后期的维护复杂度,反而比美苏的路线更低。
今天的DeepSeek,某种程度上,干的正是这份“祖传的手艺”。
OpenAI的信仰是“Scaling Law”(规模定律),用数百亿美元的资金去堆砌庞大的英伟达算力集群,追求一种暴力美学。DeepSeek深知自身无法在纯硬件规模上与之抗衡,于是他们将全部精力投入到了“精打细算”上。通过采用极致的MoE(混合专家)架构,以及类似记忆与计算分离的Engram等技术,在软件和算法层面进行深度优化。
其目标很明确:用性能可能落后一代的国产芯片,通过独特的软件级优化与架构设计,跑出世界顶尖的模型效果。 如果这一目标达成,意味着中国AI产业“算法—硬件—数据”的自主闭环,将在V4这一代模型上,实现真正的合拢。
那么,耗费如此巨大心血、深度适配国产算力才诞生的V4,还会像前代那样坚持开源吗?
先说结论:不仅会开源,而且这次开源,很可能是一场精心策划的“阳谋”。
试想,如果华为、寒武纪的芯片只能在中国市场销售,那它们终其一生也只能是“局域网巨头”,永远无法成长为能与英伟达正面竞争的全球性霸主。如何才能让全世界的开发者和企业心甘情愿地购买你的芯片?
你必须给他们一个无法拒绝的理由。
而DeepSeek V4,就是这个“理由”。当V4开源后,硅谷的极客、欧洲的研究机构、中东的资本在下载使用这个顶级模型时,可能会发现一个关键事实:由于V4在底层是深度为国产芯片优化定制的,使用英伟达显卡来运行,其性价比和能效比,反而不如直接采用中国的AI芯片方案。
届时,为了获得最佳的模型体验与总拥有成本(TCO),全球用户将可能主动转向寻求中国“软硬一体”的整套解决方案。
过去,我们出海的是纺织品和智能手机。现在,DeepSeek正试图以开源的顶尖人工智能算法为先锋,带动国产算力芯片,一起驶向全球AI竞速的新蓝海。
当V4最终揭开面纱的那一刻,它或许将再次证明,这是中国科技在重重封锁之下,用“算法”这把新时代的“算盘”,敲出的又一记震耳欲聋的惊雷。这场围绕算力与智能的角逐,值得我们持续关注。对于这类前沿技术动态的深度讨论,欢迎来到云栈社区的开发者广场板块,与更多同行交流见解。