找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3681

积分

0

好友

515

主题
发表于 2026-2-13 07:46:16 | 查看: 39| 回复: 0

DeepSeek 近期悄悄更新了其模型能力,带来了几项值得关注的提升。究竟是不是大家期待的 V4 版本?让我们通过实际测试来一探究竟。

DeepSeek AI助手自我介绍页面

新版本有什么不同?

一、超长上下文

新版本支持处理更长的文本输入,达到了 1M Token(百万级别)——如果属实,这个容量可以一次性处理《三体》三部曲那么多内容。相比之前 V3.1 的 128K Token,这是近 10 倍的提升。这对于处理长篇文档、代码仓库或复杂的研究论文来说,无疑是一个巨大的进步。

二、知识更新了

模型在不联网的情况下,已经能准确回答 2025 年上半年的一些事件。知识截止日期从之前的 2024 年 7-8 月更新到了 2025 年 5 月左右。这意味着模型对于近期发生的事件、技术动态有了更好的把握。

三、回答风格变了

新版本的语言风格明显变得更“热情”、更细腻。看起来 DeepSeek 可能在用户体验上做了一些调整,试图让对话感觉更自然、更具亲和力。

四、依然是纯文本

这次更新目前没有加入视觉理解能力,模型仍然只能处理文本和语音,不能直接“看懂”图片(虽然可以通过 OCR 读取图片中的文字)。

DeepSeek实测

如今Agentic Coding能力十分重要,@PaperAgent 简单测了一个烟花coding的案例:

打造一个震撼人心的动画烟花盛宴!用单一HTML文件,融合CSS与JavaScript,让屏幕瞬间化为璀璨夜空。烟花要有多种颜色、爆炸轨迹,最好能自动循环绽放。

思考更充分,速度挺快,效果比之前要更加酷炫~

最后测了一个近期较火的经典逻辑难题,快速模式下翻车了。

关于短距离洗车利弊分析的思考过程截图

深度思考模式下是正确的。

关于洗车需开车前往的逻辑推理截图

DeepSeek 2026 的技术三连发

值得注意的是,DeepSeek 开年的技术三连发,这些新研究可能为未来的模型升级铺平了道路。

DeepSeek 2026年技术发布计划表格

  • 元旦期间公布了 mHC(流形约束超连接)论文,提出了一种新的网络架构设计思路。
  • 1 月 12 日发布了 Engram 论文和代码,探索“条件记忆”机制。
  • 1 月 27 日开源了 OCR-2 模型,视觉压缩能力提升明显。

这些技术是否已经应用到当前测试版本中?目前还不确定。但从时间节点来看,这些研究成果很可能会出现在即将发布的、能力更强的版本里,为 AI 模型的进一步发展提供底层支持。

总的来说,这次更新虽然可能并非传闻中的V4,但在上下文长度和知识新鲜度上的提升是实打实的。对于开发者而言,这意味着能处理更复杂的任务和更长的代码库。如果你想了解更多前沿技术动态或与其他开发者交流,不妨来 云栈社区 看看。




上一篇:Linux USB设备识别/速度/状态查询失败?常用调试方法与排查节点详解
下一篇:siduction滚动更新系统评测:Debian Sid的易用前端,是否值得桌面用户尝试?
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-2-23 12:58 , Processed in 0.680059 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表