云栈社区»论坛 › 开发者广场「Dev Plaza」 › Claude Mythos模型信息遭意外泄露，Anthropic警示其网络安全能力 ...

发回帖发新帖

4126 积分	0 好友	542 主题

发消息

Claude Mythos模型信息遭意外泄露，Anthropic警示其网络安全能力带来新风险

发表于 2026-3-29 02:13:29 | 查看: 154| 回复: 0

昨天晚上，Fortune 杂志爆出一篇独家新闻：致力于人工智能安全的明星公司 Anthropic，正在秘密测试一个名为 Claude Mythos 的新模型。令人啼笑皆非的是，这个机密信息并非通过黑客攻击或内鬼泄密公之于众，而是因为自家内容管理系统（CMS）的一个配置失误，被“公开”给了所有能访问其URL的人。

这本身就颇具讽刺意味——一家以AI安全为立身之本的公司，竟然在最基础的信息安全环节栽了跟头。

但比起泄露事件本身，模型泄露出的信息更值得关注。在官方回应中，Anthropic 使用了一个分量极重的词：“step change”（阶跃式进步）。这可不是普通的性能提升，而是一种“质变”。

社交媒体关于Claude Mythos泄露事件的推文截图

泄露是如何发生的？

事情的原委并不复杂。据报道，Anthropic 使用的 CMS 有一个默认设置：上传的数字资产默认是公开的。如果上传者不手动将其设置为私有，任何人只要能拿到正确的 URL，就可以直接访问这些文件。

剑桥大学的网络安全研究员 Alexandre Pauwels 和 LayerX Security 的高级 AI 安全研究员 Roy Paz 分别独立发现了这个公开的数据缓存。经 Pauwels 评估确认，这个缓存中包含了 近 3000 份 与 Anthropic 博客关联的未发布资产。

社交媒体关于CMS配置错误导致文件泄露的推文截图

这些被意外公开的文件里究竟有什么？

一篇未发布的产品发布博客草稿，详细描述了 Claude Mythos 模型。
员工的产假信息（个人隐私也未能幸免）。
一份在欧洲举办、由 CEO Dario Amodei 亲自出席的CEO闭门峰会邀请函PDF。

Anthropic 的回应将此归咎于“人为失误”，并在收到 Fortune 的通知后立即关闭了公开访问权限。虽然处理速度尚可，但这个低级错误的责任无法推脱。

Claude Mythos 是什么级别的模型？

这才是整个事件的核心。

目前，Anthropic 公开的模型产品线分为三个层级：Haiku（最小最快）、Sonnet（性能均衡）和 Opus（功能最强）。然而，泄露的博客草稿揭示了一个全新的、更高的层级——Capybara（水豚）。

草稿中的表述非常直接：

“Capybara 是一个新层级的名称：比我们的 Opus 模型更大、更智能——而 Opus 此前是我们最强大的模型。”

Mythos 和 Capybara 指向的是同一个底层模型。Capybara 是面向用户的产品层级名称，而 Mythos 则是该模型的内部代号。

社交媒体关于Mythos模型性能的推文截图

根据泄露的文档，与前代的 Claude Opus 4.6 相比，Capybara 在 软件编码、学术推理和网络安全 等关键测试中“取得了显著更高的分数”。Anthropic 的官方回应也证实，他们正在开发一个“在推理、编码和网络安全方面有实质性进展的通用模型”，并且正与“少量早期接入客户”一同进行测试。

最令人担忧的部分：网络安全能力

泄露的博客草稿中有一段话引起了广泛关注与不安：

“（该模型）目前在网络安全能力方面远远领先于其他任何 AI 模型。它预示着即将到来的一波模型浪潮——它们利用漏洞的速度将远远超过防御者的修复速度。”

这段话的潜台词甚至让 Anthropic 自己都感到了紧张。

因此，他们制定了明确的发布策略：优先将模型提供给网络安全防御方使用。目的是让安全团队能够提前掌握这个强大的工具，用以加固自身的系统和代码库。因为他们预见到，具备同等或类似能力的模型迟早会被攻击者所利用。

这并非杞人忧天。就在今年2月，OpenAI 发布 GPT-5.3-Codex 时，首次将其归类为适用于网络安全任务的“高能力”模型。而 Anthropic 现有的 Opus 4.6 模型已经展示出发现生产环境代码中未知漏洞的潜力。

更现实的威胁已然存在：Anthropic 曾披露过一个案例，一个与政府相关的黑客组织利用 Claude Code 对大约 30 个组织（包括科技公司、金融机构和政府部门）发起了协同攻击。Anthropic 耗费了10天时间才完全摸清攻击范围、封禁相关账号并通知所有受影响方。

这次事件说明了什么？

首先，AI模型的迭代速度正在飞速提升，但与之配套的安全护栏建设仍在奋力追赶。 Anthropic 已是业界公认最重视安全的AI公司之一，却仍会犯下CMS配置这种低级错误。模型的能力越强大，一旦发生信息泄露，其后果也越严重。

其次，“网络安全能力”正迅速演变为评估前沿模型的核心维度之一。 它不再仅仅是一个附加功能，而是直接影响模型发布策略和风险评估的关键因素。Anthropic 因此选择先向防御方开放，OpenAI 也在其 Preparedness Framework（准备框架）中专门加入了网络安全评估维度。

最后，Capybara层级的出现意义重大。 这意味着 Anthropic 的产品线从三档扩充为四档。更大、更智能、成本可能也更高——这不仅仅是一个新模型，更是一次商业定位的全面升级。它明确瞄准了企业客户中那些最愿意为顶级AI能力付费的群体。那份泄露的、在英国乡间庄园举办的CEO闭门峰会邀请函，正是这一高端市场战略的体现。

写在最后

一个以AI安全为标杆的公司，因为一个CMS的默认设置，将自己最大的商业和技术秘密暴露在了全世界面前。

这像不像一个现实的隐喻？我们常常担忧AI技术本身会带来巨大的安全威胁，但有时，最大的漏洞并不存在于复杂的模型之中，而在于操作这些技术的人身上。

Claude Mythos 何时会正式发布尚无定论。但有一点已经非常清晰：在AI军备竞赛的下一轮竞争中，安全既是吸引客户的关键卖点，更是不可逾越的底线。对于开发者社区而言，关注此类前沿动态，理解其背后的技术逻辑与潜在风险，是拥抱AIGC时代不可或缺的一环。更多关于AI、安全与前沿技术的深度讨论，欢迎在云栈社区交流分享。

上一篇：ECC项目上下文窗口优化策略：解析Claude Code的Agent压缩与Token管理
下一篇：内容创作者高效工作流：用ChatGPT/DeepSeek生成结构，XMind呈现的免费组合

ClaudeMythos, Anthropic, 人工智能, 网络安全, 信息安全