
Anthropic表示,其Claude Mythos Preview模型能够在数小时甚至几分钟内,构建出针对已知漏洞的可用攻击代码。
该模型于今年4月初发布,被宣传为最具能力的AI前沿模型。从发布之初,外界就担心它会被用于增强网络攻击能力。
4月到5月期间,Anthropic曾宣称该模型具备强大的漏洞发现能力,包括发现271个Firefox漏洞以及超过1000个开源软件项目中的数千个严重安全缺陷。
如今,该公司表示,其最先进的模型还能够将这些发现“武器化”——这意味着AI在网络攻击中的广泛应用,进一步加剧了组织在“补丁空窗期”所面临的威胁。
在实际测试中,Claude Mythos Preview在数小时内就交付了16个可用的漏洞利用代码,目标包括Firefox和Windows。
Anthropic也对自家的公开模型(关闭安全防护后)进行了测试。这些模型虽然未达到Mythos的水平,但也成功生成了可用的漏洞利用代码。这大大语言模型显著提升了“N-Day”漏洞的威胁——尤其是那些此前从未被实际攻击利用过的N-Day。
为什么N-Day比0-Day更危险?
Anthropic指出,N-Day漏洞(已公开但未修复或部分修复的已知漏洞)实际上比0-Day更加危险,因为攻击者可以通过补丁对比(patch diff)和逆向工程来构建漏洞利用代码。
这正是大语言模型成为攻击者有力武器的关键所在——它们能够极大加速并自动化N-Day漏洞利用的开发过程。
Anthropic解释:“漏洞利用开发并非真实N-Day攻击活动中的唯一环节(还需要目标发现、漏洞投递、检测规避等),但从历史上看,它一直是最受逆向工程稀缺人才制约的环节。”
8分钟完成Firefox漏洞概念验证代码
为了验证这一理论,该公司测试了Mythos Preview、Opus和Sonnet模型针对Firefox 148和149版本中发布的18个SpiderMonkey安全补丁构建概念验证代码的能力。所有模型都在几分钟内交付了结果。
Opus 4.8创建了11个概念验证代码,Mythos Preview创建了14个。Opus 4.8在8分钟内交付了首个概念验证代码,而Mythos Preview则用了12分钟。
Anthropic还测试了模型将崩溃转化为可工作利用代码的能力。Mythos Preview构建了8个,Opus 4.8构建了2个,Opus 4.6和Sonnet 4.6各构建了1个。
Anthropic表示:“这是Mythos Preview真正拉开差距的地方。Mythos Preview在不到一小时内写出了它的第一个可工作利用代码,并在大约12小时内总共创建了8个不同的利用代码。”
18小时内发现8个Windows漏洞
接下来,Anthropic测试了大语言模型针对闭源软件构建漏洞利用的能力,并选择了微软Windows平台作为目标。他们选取了2026年1月至2月期间披露的21个内核漏洞。
Anthropic指出:“这要困难得多,因为没有源代码可用,模型必须从编译后的二进制文件和经过反编译器重构的代码入手,而这些代码已经失去了变量名、类型和结构等有助于理解的上下文信息。”
Sonnet 4.6和Opus 4.7为其中13个漏洞构建了能触发蓝屏死机的概念验证代码,Opus 4.8完成了15个,Mythos Preview完成了18个。Mythos Preview在31分钟内交付了首个概念验证代码。
Mythos Preview还能够为其中8个漏洞创建导致权限提升的可工作利用代码,并在18小时内全部交付。
Anthropic指出,通常情况下,Windows补丁需要7天才能推送到一个设备群中90%的已注册设备,而且这些设备通常要到第11天才会被强制重启。这意味着,在该模型的速度下,攻击者完全可以在补丁空窗期内完成漏洞利用。
漏洞利用门槛降低,补丁更新需加快
Anthropic认为,按照现有速度,Mythos Preview将在任何Windows设备收到补丁更新之前,就完成所有八个完整链式漏洞利用程序的创建。虽然要将这些漏洞利用程序转化为实际攻击行动仍需进一步工作,但Mythos Preview现已将其中最耗时的步骤之一压缩至数小时之内。
开发这些漏洞利用程序的成本也不高。每个模型都获得了300万Token的预算,用于开发针对Firefox的概念验证(PoC)和漏洞利用程序。开发针对Windows的完整链式漏洞利用程序的成本为15,700美元的API积分,即每次权限提升约2,000美元。
Anthropic表示,如今对N-day攻击的限制仅剩几千美元和API访问权限,这使得具备N-day攻击能力的攻击者群体大幅扩大。该公司呼吁更新补丁修复指南,应以“N小时”而非“N-day”为基准,且不应再假设将补丁武器化需要数周时间:
“从历史来看,N-day漏洞对那些更新缓慢或难以打补丁的系统造成的危害最大。工业控制系统、医疗设备和‘物联网’设备通常遵循固定的维护窗口,使用供应商锁定的固件,或者有运行时间保证。随着将任意补丁武器化的成本趋近于零,这些设备和系统将面临更大的风险。即便是那些遵循既定、‘负责任’补丁发布周期的系统,如今也比以往更容易成为攻击目标。”
参考来源:
Mythos Preview can weaponize N-day vulnerabilities in hours
https://www.helpnetsecurity.com/2026/06/09/anthropic-mythos-preview-n-day-exploits-firefox-windows/