云栈社区»论坛 › 开发者广场「Dev Plaza」 › DeepSeek V4寻求百亿美元融资，技术路线转向华为昇腾芯片摆脱英 ...

发回帖发新帖

5708 积分	0 好友	750 主题

发消息

DeepSeek V4寻求百亿美元融资，技术路线转向华为昇腾芯片摆脱英伟达依赖

发表于 2026-4-20 11:29:48 | 查看: 169| 回复: 0

梁文锋在发布会上介绍DeepSeek V4

今早，AI行业被一则重磅消息震动。

据外媒 The Information 独家报道，一直坚持“不融资”原则的中国AI公司 DeepSeek 正在寻求其历史上首次外部融资。该公司计划以不低于100亿美元的估值，筹集至少3亿美元资金。在极度消耗资源的人工智能大模型开发竞赛中，即便是以效率著称的DeepSeek，也开始需要补充资金弹药库了。

DeepSeek融资概念图

曾经的DeepSeek，其母公司为对冲基金巨头幻方量化，在旗下模型R1引发全球关注后，曾多次拒绝国内外顶级风投和科技巨头的投资意向。此次启动融资，意味着创始人梁文锋及其团队做出了重大战略转变。此前，这位技术理想主义者一直希望保持DeepSeek的独立性，免受商业化压力干扰。

DeepSeek V4的发布时间已多次推迟，而全球AI竞赛的格局早已今非昔比。从OpenAI到Anthropic，再到中美科技巨头，都在凭借雄厚的资本实力加速模型迭代。或许，正是这种竞争压力最终促使DeepSeek改变了其融资策略。

如果融资成功，DeepSeek将获得更多用于模型训练的 Computing Power，同时也能开出更具竞争力的薪酬，防止顶尖AI研究人才流失。不过，由于DeepSeek的“中国初创公司”身份，部分美国风险投资人的态度可能趋于谨慎。

V4，一场万亿参数的硬仗

根据多方信息，V4原定于今年2月发布，但已跳票数次。路透社在4月初给出的最新预测是“未来几周内”。从目前已泄露的信息来看，V4的规模和技术野心远超其前代产品。

参数量跃升至万亿级别。
V4采用了MoE（混合专家）架构，总参数量约为1万亿，但每个token激活的参数约为370亿，旨在将推理成本控制在与V3相当的水平。这延续了DeepSeek一贯的“效率优先”设计哲学。

DeepSeek V4 架构爆料图

上下文窗口扩展至100万token。
V4引入了一套名为 “Engram” 的条件记忆架构，据称能实现对超长上下文的恒定时间检索。内部测试数据显示，在100万token长度下的信息召回率高达97%，远超V3在128K上下文中的表现。

DeepSeek V4 Engram架构示意图

原生多模态支持。
据英国《金融时报》报道，V4将是DeepSeek首个原生多模态模型，支持文本、图像乃至视频的生成与理解。此前DeepSeek的模型一直专注于纯文本领域。
代码能力大幅强化。
V4从立项之初就将代码生成作为核心目标。内部基准测试显示，其在SWE-bench上的成绩超过80%，HumanEval达到90%。据称V4能够处理整个代码仓库级别的复杂Bug修复，在长上下文代码推理任务上的表现有望超越Claude和GPT系列。

此外，有爆料称V4预计将分两个版本发布：完整版参数量超万亿，针对高级推理和复杂代码任务优化，面向华为昇腾芯片；轻量版约2000亿参数，面向通用对话和API服务，可在其他国产芯片上运行。在开源策略上，V4计划继续以Apache 2.0协议开放权重。

种种迹象表明V4已进入部署前最后的准备阶段。3月9日，一个名为“V4 Lite”的版本曾短暂出现在DeepSeek平台上；4月初，有开发者在API节点上发现了V4 Lite的测试版本，其推理速度提升30%，128K上下文的信息召回率从45%跃升至94%。同时，DeepSeek近期在内蒙古乌兰察布发布了服务器运维工程师等算力基础设施相关岗位的招聘，这被视为为大模型上线做准备的明确信号。

老黄最不想看到的事正在发生

V4一再延期的核心原因，或许与模型本身的研发关系不大，真正的挑战在于一场底层的硬件生态大迁移。

DeepSeek此前所有模型都基于英伟达（NVIDIA）芯片进行训练和推理，但V4选择了一条不同的道路。据路透社报道，V4将主要运行在华为最新的昇腾（Ascend）芯片上。为此，DeepSeek的工程师团队投入了大量时间解决V4对华为芯片的适配问题，重写核心代码，从英伟达的CUDA生态迁移至华为的CANN架构。

这不仅是一个技术决策，更是一个强烈的战略信号。据悉，DeepSeek并未提前向英伟达或AMD提供V4以进行优化适配，而是将早期访问权限独家给予了国产芯片厂商。如果V4最终能在华为昇腾芯片上展现出具有竞争力的性能，它将成为全球首个不依赖英伟达生态的前沿AI大模型。

英伟达CEO黄仁勋（Jensen Huang）本人对此也表达了忧虑。他在近期的采访中直言，DeepSeek基于华为平台的新模型“对美国来说将是一个糟糕的结果”。其言下之意是，一旦前沿AI模型被深度优化，从而在中国本土硬件上获得最佳运行效果，美国芯片长期以来构筑的技术护城河将面临松动。

黄仁勋在接受访谈

3亿美元，赌一个脱离英伟达的未来

如今，即便是以“花小钱办大事”著称的DeepSeek，也无法仅靠单一母公司的持续输血来应对这场全球军备竞赛。根据斯坦福大学2026年度的AI指数报告，截至今年3月，美国顶级模型与中国最强竞品之间的性能差距仅剩2.7个百分点。差距越小，每向前追赶一步所需的边际成本就越高。

作为对比，OpenAI在3月31日刚刚以高达8520亿美元的估值完成了1220亿美元的融资。DeepSeek寻求的3亿美元，相比之下似乎只是零头。但V4真正的赌注，在于它要证明一件事：最前沿的AI大模型完全可以脱离英伟达生态独立运转。这3亿美元，押注的正是这个可能改变全球AI硬件格局的未来。

参考资料：
https://www.theinformation.com/articles/chinas-deepseek-raising-money-first-time-10-billion-plus-valuation?rc=epv9gi

上一篇：GitHub提示注入攻击：一条评论即可劫持AI代理并窃取密钥
下一篇：Anthropic联创谈AI时代编程技能转型：从套路代码到哲学思考

DeepSeek, Transformer, MoE, 华为昇腾, 人工智能

DeepSeek V4寻求百亿美元融资，技术路线转向华为昇腾芯片摆脱英伟达依赖

V4，一场万亿参数的硬仗

老黄最不想看到的事正在发生

3亿美元，赌一个脱离英伟达的未来

相关帖子