据相关科技媒体报道,距离春节尚有一个月左右的时间,全球开发者社区都在关注一个问题:DeepSeek何时会发布其新一代大模型?回顾去年春节前夕,DeepSeek R1的发布可谓开启了开源大模型追赶顶尖闭源模型的浪潮。
近日,有知情人士透露,DeepSeek计划在未来几周内正式推出其新一代旗舰级大模型。与以往不同,本次发布的核心亮点将聚焦于代码生成能力,直指当前热门的AI编程领域。
据悉,这款新模型的内部代号为DeepSeek V4,是去年12月发布的DeepSeek V3模型的迭代版本。根据DeepSeek公司内部的初步基准测试结果,V4模型在代码生成任务上的表现,已经超越了包括Claude、ChatGPT在内的当前主流大模型。

此前已有较为可靠的消息指出,DeepSeek未来的模型路线图可能不再严格区分“通用”与“推理”系列。因此,DeepSeek V4很可能融合了传闻中DeepSeek R2的能力,将强大的推理与代码生成功能合二为一,此番强化AI编程能力也在业界的预料之中。
不过,仔细审视部分外媒的原始报道,其中对“Anthropic、Claude、生成式预训练变换器系列(OpenAI GPT)”等术语的并列描述显得不够专业,这种表述方式在专业报道中并不常见,因此也引发了关于消息来源可靠性的讨论。
尽管如此,关于DeepSeek将在春节前后发布V4大模型的消息并非空穴来风。在国内社交媒体上,确实能看到一些行业人士透露,DeepSeek在春节前后“会有动作”。更令人期待的是,此次惊喜或许不止于大模型本身。有消息暗示,在国产AI芯片方面也可能有新的进展披露。
最终,这一切是确切的行业预告还是市场的期待,目前尚无定论,答案只能等待时间来揭晓。对大模型和AI编程领域进展感兴趣的开发者,不妨保持关注。欢迎到 云栈社区 的对应板块,与更多同行交流前沿技术动态。
|