昨天,DeepSeek V4 发布,直接刷屏整个 AI 圈。
如果说 V3 的横空出世让世界看到了中国算法的“暴力美学”,那么 V4 的登场,则宣告了一个旧时代的终结——“大模型训练必须依赖 NVIDIA”的时代,可能真的即将结束。
就在 V4 发布前夕,英伟达 CEO 黄仁勋在做客 Dwarkesh Patel 的播客时,罕见地流露出了焦虑。他直言,如果像 DeepSeek 这样的顶尖开源模型公司,将其下一代模型率先在华为等国产平台上进行深度优化和首发,那对美国技术霸权来说将是“灾难性”的。
他怕的不是一个模型,而是一个生态的易主。长期以来,全球 AI 开发者默认“大模型 = 英伟达 GPU + CUDA 架构”。但 DeepSeek V4 这次选择与华为昇腾(Ascend 950 系列)深度共创,将底层代码从 CUDA 迁移到了华为自研的 CANN 框架。
这意味着,中国最强的软件算法,正在与最强的国产算力硬件完成“完美融合”。
基于我个人的观察,DeepSeek V4 的发布,主要有以下三点突破。
1/ 生态“去CUDA化”
过去国产大模型总被诟病“适配难”,而 V4 证明了在华为昇腾平台上,大模型的推理性能不仅能跑通,甚至能跑得比英伟达更好、更省、更高效。
2/ 算力性价比的碾压
V4 在昇腾 950 超节点上的表现,在百万级超长上下文处理上达到了业内顶尖水平。这种“软硬一体”的深度优化,极大降低了中国企业使用 AI 的成本。
3/ 技术封锁的失效
美国试图通过切断高端芯片供应来锁死中国 AI,但 DeepSeek V4 + 华为昇腾的组合给出了回答:限制买卖,锁不住我们的自主进化。
以前国内的大模型厂家都担心没有 H100、H200 就做不出顶级 AI。但现在 DeepSeek 用行动告诉世界:算法的极致压缩 + 国产硬件的底层突破,同样可以通向 AGI。
黄仁勋的“恐惧”并非虚言,因为 DeepSeek 走的是一条 开源路线。当全球开发者发现,即使没有昂贵的英伟达芯片,也能在更普惠、更自主的国产硬件平台上运行最先进的开源模型时,英伟达筑起的高墙将面临崩塌。
毫不客气地说:DeepSeek V4 的这一小步,是中国算力自主化的一大步。
这一刻,我们不再是追随者,而是规则的重新定义者。
|