今天一早,打开朋友圈和微博,满屏都是“DeepSeek崩了”的讨论。从昨晚九点半左右开始,网页端无法访问,API调用不通,甚至连正在进行的对话历史记录也直接丢失。这大概是DeepSeek上线以来最严重的一次服务中断事故,持续时间将近12个小时,直到今天上午十点半左右才陆续恢复。
本以为只是一次普通的服务器波动,但观察下来,发现事情可能没那么简单。

昨晚各个技术社群和开发者广场已经炸开了锅。有朋友正在赶论文,有同行在调试代码,最无奈的是那些把DeepSeek当作树洞进行角色扮演的用户,正聊到关键剧情,直接“断片”了。官方的服务状态页面只标注了“重大停机”,后来流传的DDoS攻击说法也并未得到官方证实。
然而,真正让技术爱好者们感到在意的,或许不是宕机本身,而是宕机前那波“异常表现”。
有细心的用户发现,在29号晚上,DeepSeek网页版似乎突然变强了。例如,在面对经典的“用SVG画一只鹈鹕骑自行车”这类考验模型生成能力的任务时,那晚的生成效果明显比一周前提升了一大截,构图和色彩都有肉眼可见的优化。而且,当用户询问“你是谁”时,它会稳定地回复“我是DeepSeek-V3模型”。要知道在一周前,同样的问题它只会含糊地回答“我是纯文字AI助手”,根本不提及具体版本号。
这种静默升级的操作,DeepSeek团队已经不是第一次做了。
更关键的线索在于模型的“知识截止日期”。在不开启联网搜索功能的情况下,现在的模型知道2025年美国大选的结果,却不知道2026年2月发生的事情。据此有人推测,这个静默更新的版本,其知识截止日期可能被设定在了2026年1月。如果只是普通的微调优化,通常没必要去调整这个核心的时间戳参数。

这究竟是微调后的V3,还是传说中的V4?官方至今未作任何说明。
但结合DeepSeek上周一口气放出17个招聘岗位的信息来看,事情或许并不简单。这些岗位几乎全部集中在Agent(智能体)方向,从算法研究、数据评测到基础设施,实现了全链条布局。招聘描述中反复出现一个词——“Vibe Coding”,并明确要求“重度使用Claude Code、Cursor、Copilot等AI编程工具的优先”。这其中的指向性非常强烈。
实际上,今年3月初,DeepSeek V4的相关信息就已经被一些媒体曝光过。据当时流传的信息,V4将主打原生多模态(支持图片、视频理解)、深度适配国产芯片(优先华为昇腾、寒武纪),并且继续维持其极致的性价比路线,训练成本相比前代预计再降低40%-50%。如果真能在多模态能力上实现如此显著的成本控制,那么国内AI技术落地的想象空间无疑会变得更大。
一个值得玩味的细节是:据称V4在发布时,首次没有为英伟达和AMD提供早期访问权限,而是让华为、寒武纪的团队优先适配了几周。这不仅是技术路径的选择,更像是传递了一种构建自主生态的战略信号。

目前,网页版服务虽然已经恢复,但似乎仍存在一些bug。如果用户开启“深度思考”模式,模型会完整地走完思考过程,然后直接卡住,最终在正文里一个字都不输出。如果不开启深度思考,从模型的自我介绍来看,其版本似乎又回滚到了旧版本。这种修复状态,怎么看都像是一种临时的、为保稳定而采取的回退方案。
甚至有调皮的网友把“DeepSeek为什么崩了”这个问题丢给了其他AI模型,得到的回答也颇有意思。

说白了,这次长达12小时的服务中断,可能并非简单的流量过载所致。它更像是在进行新版本灰度测试或某种重大部署时,出现了意外“翻车”。从春节前后就传闻V4即将发布,后来推迟到3月,现在马上进入4月依然没有确切消息。官方的沉默,反而让外界感觉他们可能正在准备一个大动作。
合理的推测是,这次宕机大概率是新版本在灰度上线过程中出现了意外。可能是算力准备不足、资源调度出现问题,正好暴露了团队在推进新功能时的工程挑战。但话说回来,能在硬件条件相对受限的情况下,持续迭代并跑出有竞争力的模型,DeepSeek团队的技术积累确实值得关注。这次事件也为关注人工智能领域动态的开发者们提供了一个观察窗口。
你们这两天在使用DeepSeek时,有没有感觉到什么不同?是觉得它突然变“聪明”了,还是同样遇到了卡顿或对话丢失的问题?欢迎来云栈社区的讨论区分享你的体验,或许我们能从中发现更多关于这次事件和技术迭代的线索。