昨天晚上,Fortune 杂志爆出一篇独家新闻:致力于 人工智能 安全的明星公司 Anthropic,正在秘密测试一个名为 Claude Mythos 的新模型。令人啼笑皆非的是,这个机密信息并非通过黑客攻击或内鬼泄密公之于众,而是因为自家内容管理系统(CMS)的一个配置失误,被“公开”给了所有能访问其URL的人。
这本身就颇具讽刺意味——一家以AI安全为立身之本的公司,竟然在最基础的信息安全环节栽了跟头。
但比起泄露事件本身,模型泄露出的信息更值得关注。在官方回应中,Anthropic 使用了一个分量极重的词:“step change”(阶跃式进步)。这可不是普通的性能提升,而是一种“质变”。

泄露是如何发生的?
事情的原委并不复杂。据报道,Anthropic 使用的 CMS 有一个默认设置:上传的数字资产默认是公开的。如果上传者不手动将其设置为私有,任何人只要能拿到正确的 URL,就可以直接访问这些文件。
剑桥大学的网络安全研究员 Alexandre Pauwels 和 LayerX Security 的高级 AI 安全研究员 Roy Paz 分别独立发现了这个公开的数据缓存。经 Pauwels 评估确认,这个缓存中包含了 近 3000 份 与 Anthropic 博客关联的未发布资产。

这些被意外公开的文件里究竟有什么?
- 一篇未发布的产品发布博客草稿,详细描述了 Claude Mythos 模型。
- 员工的产假信息(个人隐私也未能幸免)。
- 一份在欧洲举办、由 CEO Dario Amodei 亲自出席的CEO闭门峰会邀请函PDF。
Anthropic 的回应将此归咎于“人为失误”,并在收到 Fortune 的通知后立即关闭了公开访问权限。虽然处理速度尚可,但这个低级错误的责任无法推脱。
Claude Mythos 是什么级别的模型?
这才是整个事件的核心。
目前,Anthropic 公开的模型产品线分为三个层级:Haiku(最小最快)、Sonnet(性能均衡)和 Opus(功能最强)。然而,泄露的博客草稿揭示了一个全新的、更高的层级——Capybara(水豚)。
草稿中的表述非常直接:
“Capybara 是一个新层级的名称:比我们的 Opus 模型更大、更智能——而 Opus 此前是我们最强大的模型。”
Mythos 和 Capybara 指向的是同一个底层模型。Capybara 是面向用户的产品层级名称,而 Mythos 则是该模型的内部代号。

根据泄露的文档,与前代的 Claude Opus 4.6 相比,Capybara 在 软件编码、学术推理和网络安全 等关键测试中“取得了显著更高的分数”。Anthropic 的官方回应也证实,他们正在开发一个“在推理、编码和网络安全方面有实质性进展的通用模型”,并且正与“少量早期接入客户”一同进行测试。
最令人担忧的部分:网络安全能力
泄露的博客草稿中有一段话引起了广泛关注与不安:
“(该模型)目前在网络安全能力方面远远领先于其他任何 AI 模型。它预示着即将到来的一波模型浪潮——它们利用漏洞的速度将远远超过防御者的修复速度。”
这段话的潜台词甚至让 Anthropic 自己都感到了紧张。
因此,他们制定了明确的发布策略:优先将模型提供给网络安全防御方使用。目的是让安全团队能够提前掌握这个强大的工具,用以加固自身的系统和代码库。因为他们预见到,具备同等或类似能力的模型迟早会被攻击者所利用。
这并非杞人忧天。就在今年2月,OpenAI 发布 GPT-5.3-Codex 时,首次将其归类为适用于网络安全任务的“高能力”模型。而 Anthropic 现有的 Opus 4.6 模型已经展示出发现生产环境代码中未知漏洞的潜力。
更现实的威胁已然存在:Anthropic 曾披露过一个案例,一个与政府相关的黑客组织利用 Claude Code 对大约 30 个组织(包括科技公司、金融机构和政府部门)发起了协同攻击。Anthropic 耗费了10天时间才完全摸清攻击范围、封禁相关账号并通知所有受影响方。
这次事件说明了什么?
首先,AI模型的迭代速度正在飞速提升,但与之配套的安全护栏建设仍在奋力追赶。 Anthropic 已是业界公认最重视安全的AI公司之一,却仍会犯下CMS配置这种低级错误。模型的能力越强大,一旦发生信息泄露,其后果也越严重。
其次,“网络安全能力”正迅速演变为评估前沿模型的核心维度之一。 它不再仅仅是一个附加功能,而是直接影响模型发布策略和风险评估的关键因素。Anthropic 因此选择先向防御方开放,OpenAI 也在其 Preparedness Framework(准备框架)中专门加入了网络安全评估维度。
最后,Capybara层级的出现意义重大。 这意味着 Anthropic 的产品线从三档扩充为四档。更大、更智能、成本可能也更高——这不仅仅是一个新模型,更是一次商业定位的全面升级。它明确瞄准了企业客户中那些最愿意为顶级AI能力付费的群体。那份泄露的、在英国乡间庄园举办的CEO闭门峰会邀请函,正是这一高端市场战略的体现。
写在最后
一个以AI安全为标杆的公司,因为一个CMS的默认设置,将自己最大的商业和技术秘密暴露在了全世界面前。
这像不像一个现实的隐喻?我们常常担忧AI技术本身会带来巨大的安全威胁,但有时,最大的漏洞并不存在于复杂的模型之中,而在于操作这些技术的人身上。
Claude Mythos 何时会正式发布尚无定论。但有一点已经非常清晰:在AI军备竞赛的下一轮竞争中,安全既是吸引客户的关键卖点,更是不可逾越的底线。对于开发者社区而言,关注此类前沿动态,理解其背后的技术逻辑与潜在风险,是拥抱AIGC时代不可或缺的一环。更多关于AI、安全与前沿技术的深度讨论,欢迎在云栈社区交流分享。