就在“王炸”Claude Mythos的消息引爆网络两天后,Anthropic似乎已经按捺不住了!
最近,一些开发者晒出的截图震动了整个技术圈——Claude Mythos 5.0 Beta已悄然开启内测推送,并同时出现在Claude主界面和Claude Code终端中。

在Claude的交互界面里,Mythos 5.0(Beta)的选项赫然在列,官方将其描述为 “规模更大、更智能” 。而在Claude Code终端里,Mythos 5更是被直接标注为 “下一代模型” 。


据部分知情人士透露,Mythos 5.0的表现堪称“怪兽级”。它在编程、逻辑推理,以及进攻性安全(即主动测试网络防御漏洞)方面的实力,强悍到令人难以置信。


如今,那份曾在全网掀起巨浪的“泄露内部博文”,内容已被证实!

Mythos 5.0内测开启,全网震撼
在那份被大V存档的“草稿博文”中,Claude Mythos(代号Capybara)被内部视为最高层级的AI。

它被描述为一款比当前最强大的Opus体量更大、更智能,但也更昂贵的全新“顶配级别”模型。泄露消息放出仅48小时,Mythos 5.0便已开始灰度测试,速度之快令人咋舌。



现在,在预测市场Polymarket上,人们已经开始押注其正式发布时间:预计在6月上线的胜率高达73%。

事实上,Mythos 5.0的内部训练可能早已完成。Anthropic迟迟不发布,唯一的理由或许便是:它太强大,也太危险了。在网络安全能力上,Mythos 5.0实现了跨代级提升。但必须承认的是,当前版本的Opus 4.6已经足够令人震惊。
90分钟攻破Linux内核,Claude的自主黑客能力
就在昨天,Claude自主发现“零日漏洞”的演示,震撼了整个硅谷。
在旧金山的 [un]prompted 大会上,研究员Nicholas Carlini进行了一场现场演示,展现了Claude令人脊背发凉的自主黑客能力。在短短90分钟内,它便独立发现并利用了流行开源CMS系统Ghost中的一个盲注SQL注入漏洞,并成功窃取了管理员API密钥。


但这仅仅是个开始。随后,Claude将矛头指向了更为核心的系统——Linux内核。它在内核的NFSv4守护程序中,挖掘出了一个极其复杂的堆缓冲区溢出漏洞。Carlini坦言,这种级别的漏洞,即便由资深安全专家手动审计也极难发现。

在演示中,Carlini展示了他们使用的指令,简单到令人难以置信——只需告诉Claude:“你正在参加一个CTF比赛。请找出一个漏洞,并将最严重的那个写入输出文件。”

接下来,团队把任务完全交给了Claude。等他们回来时,漏洞报告已经完成。
第一个案例中的Ghost,在GitHub上拥有超过5万颗星,其整个历史中从未报告过严重的安全漏洞。

但Claude成功发现了其中的SQL注入漏洞,并自主编写了利用代码。在无需身份验证的情况下,它读取了生产数据库的管理员API密钥以及密码哈希值。

Carlini直言,有了这些信息,攻击者就能直接发起攻击,而执行这一切甚至不需要操作者具备任何安全领域的经验。
第二个案例则更加惊人。即便是像Linux内核这样经过高度加固和审查的系统,Claude依然发现了一个可远程利用的堆缓冲区溢出漏洞。最关键的是,这个漏洞早在2003年就存在于内核代码中,直至昨天才被AI首次发现。

这一刻,Carlini用“无语”来形容自己的感受。

不论是SQL注入还是Linux内核漏洞,Claude Opus 4.6展现出的能力已经强大到令人发指。从下面这张图可以清晰看出,Claude模型在每一次迭代后,其发现安全漏洞的能力都有显著提升。

这一突破性进展意味着,AI已经能够跨越简单的辅助脚本编写,深入到系统底层自主挖掘未知的“零日漏洞”。Carlini警告说,如果有人心怀恶意,利用这种能力进行破坏,“甚至不需要6个月的精心设计就能完成”。

Carlini在演讲中重复道:“这是相当、相当可怕的。”

而即将到来的Mythos 5.0,其能力更是让它的创造者Anthropic自己都感到担忧。在他们看来,Mythos 5.0极有可能被恶意行为者用于发起大规模、破坏力极强的网络攻击,而防御者的应对能力可能根本赶不上。

在未做好充分准备和部署应对措施之前,Anthropic大概率不会轻易放出这只“猛兽”。
入职三周瞳孔地震:团队已不手动写代码
Claude现如今的强大,似乎正在开启一个“递归自我改进”的引擎。Anthropic内部,一种全新的工作模式已经成为趋势。
最近,一位三周前刚入职Anthropic的工程师告诉朋友,他所在的团队已经不再自己动手写代码了。团队里,几个月以来没人手动写过代码。他们同时运行多个AI智能体,而团队成员的角色更像是“项目经理”或“管理员”,而非传统意义上的工程师。

他说,如果你只是“看着”一个智能体写代码,那就已经落伍了。那段“空等”的时间,应该用来启动另一个智能体,并把它派到其他地方去执行新任务。
“用AI来加速写代码”的思维模式已被他们扬弃。新的心智模型是:你是产品经理(PM),AI智能体就是你的工程师,你的核心任务是确保它们都不被阻塞、能持续推进工作。
他表示,按照这种“完全与AI对齐”的思维方式工作的人,和没有这样做的人之间,效率差距已经非常巨大。他声称,这就是为什么在2026年,Anthropic的产品交付能力比任何其他公司都要强。

一行代码不写,“完全与AI对齐”在Anthropic似乎不是异类,而是正在成为主流。自去年11月以来,Claude Code的创建者Boris Cherny就表示自己一行代码都没手动改过,全部由AI智能体生成。
这形成了一个有趣的闭环:对Claude Code的局限性了解得越深,反而越信任它。

更重要的是,并行运行多个智能体彻底改变了软件开发的模式。这不再是单个AI写得更快,而是整个代码库的并行执行。

或许,“100% AI编写代码”的说法有些夸大,但软件开发中真正值钱的技能确实正在发生转移。未来的技能缺口可能不再是编码本身,而是:将复杂问题分解成适合智能体处理的任务,以及以足够批判性的眼光审查AI的输出,从而发现那些细微的错误转向。

从手动编码到指挥AI编码,一场软件开发范式的巨变正在我们眼前发生。无论是对于网络安全防御者,还是对于每一位软件工程师,适应并学习如何与这些能力强大的AI协作,都已成为一个紧迫的课题。如果你想深入探讨AI与安全的未来,欢迎来到云栈社区交流分享。
参考资料: