5705 积分	0 好友	745 主题

DeepSeek V4 联手华为昇腾，国产算力终结CUDA依赖时代

发表于 2026-4-27 17:09:59 | 查看: 188| 回复: 0

昨天，DeepSeek V4 发布，直接刷屏整个 AI 圈。

如果说 V3 的横空出世让世界看到了中国算法的“暴力美学”，那么 V4 的登场，则宣告了一个旧时代的终结——“大模型训练必须依赖 NVIDIA”的时代，可能真的即将结束。

就在 V4 发布前夕，英伟达 CEO 黄仁勋在做客 Dwarkesh Patel 的播客时，罕见地流露出了焦虑。他直言，如果像 DeepSeek 这样的顶尖开源模型公司，将其下一代模型率先在华为等国产平台上进行深度优化和首发，那对美国技术霸权来说将是“灾难性”的。

他怕的不是一个模型，而是一个生态的易主。长期以来，全球 AI 开发者默认“大模型 = 英伟达 GPU + CUDA 架构”。但 DeepSeek V4 这次选择与华为昇腾（Ascend 950 系列）深度共创，将底层代码从 CUDA 迁移到了华为自研的 CANN 框架。

这意味着，中国最强的软件算法，正在与最强的国产算力硬件完成“完美融合”。

基于我个人的观察，DeepSeek V4 的发布，主要有以下三点突破。

1/ 生态“去CUDA化”
过去国产大模型总被诟病“适配难”，而 V4 证明了在华为昇腾平台上，大模型的推理性能不仅能跑通，甚至能跑得比英伟达更好、更省、更高效。

2/ 算力性价比的碾压
V4 在昇腾 950 超节点上的表现，在百万级超长上下文处理上达到了业内顶尖水平。这种“软硬一体”的深度优化，极大降低了中国企业使用 AI 的成本。

3/ 技术封锁的失效
美国试图通过切断高端芯片供应来锁死中国 AI，但 DeepSeek V4 + 华为昇腾的组合给出了回答：限制买卖，锁不住我们的自主进化。

以前国内的大模型厂家都担心没有 H100、H200 就做不出顶级 AI。但现在 DeepSeek 用行动告诉世界：算法的极致压缩 + 国产硬件的底层突破，同样可以通向 AGI。

黄仁勋的“恐惧”并非虚言，因为 DeepSeek 走的是一条开源路线。当全球开发者发现，即使没有昂贵的英伟达芯片，也能在更普惠、更自主的国产硬件平台上运行最先进的开源模型时，英伟达筑起的高墙将面临崩塌。

毫不客气地说：DeepSeek V4 的这一小步，是中国算力自主化的一大步。

这一刻，我们不再是追随者，而是规则的重新定义者。