5686 积分	0 好友	727 主题

我来说说Claude Mythos模型为什么强到暂不发布

发表于 2026-4-9 02:56:43 | 查看: 193| 回复: 0

一个AI模型强到连自己的创造者都害怕发布，你觉得这事儿离谱吗？

Anthropic 最近放出了 Claude Mythos 的预览版，它的各项能力全面碾压了上一代的 Opus 4.6。但耐人寻味的是，他们并没有庆祝这个技术突破，而是宣布暂时不向公众开放。

这背后，到底发生了什么？

AI 编写代码的能力越强，它发现和利用安全漏洞的能力也就越强。这就像一枚硬币的两面，你无法只取其正面。

根据公布的信息，Mythos Preview 已经发现了数千个高危漏洞，覆盖了主流的操作系统和浏览器。这意味着什么？意味着这个 AI 在发现和利用漏洞方面的水平，已经超过了绝大多数人类黑客。目前，可能只有最顶尖的那一小撮安全专家还能与之一较高下。

你每天使用的手机系统、浏览器和各种网站，在其“视野”里可能布满了潜在的风险点。更关键的是，这种能力会随着模型的迭代而持续增强，并且迟早会以某种形式被更多人掌握。

Anthropic 做了一件 AI 公司从未做过的事：主动选择不公开发布最强的模型。以往也有实验室谈论“克制”，但大家心里都明白那多半是公关话术。这次的情况截然不同。

Anthropic 启动了一个名为“玻璃翼计划”的项目，拉上了 Amazon、Apple、Google、Microsoft、NVIDIA 等行业巨头共同参与。该计划的目的只有一个：在 Mythos 正式发布之前，让这些巨头先用预览版去全面加固自己的系统。

简单来说，就是先让“防守方”进行演练，避免正式版问世时，现有的网络基础设施被轻易“打穿”。为了推动此事，他们还提供了最高 1 亿美元的使用额度，并向开源安全组织捐赠了 400 万美元。试问，哪家公司的营销活动会这样真金白银地投入？

过去我们讨论 AI安全，许多人觉得是科学家们在贩卖焦虑。但请设想一下，当 AI 已经能够自动挖掘出数千个高危漏洞，并且其能力在未来几个月内还将跃升至新的台阶时，情况就完全不同了。

Anthropic 自己也承认，全面加固全球的网络基础设施可能需要数年时间，但 AI 的能力跃迁可能就在几个月内发生。两者之间的时间窗口正在急速收窄。

你使用的每一个 App、访问的每一个网站、进行的每一次在线支付，底层都运行在这些可能面临风险的系统之上。随着 AI模型的能力不断增强，攻防之间的天平正在发生倾斜。

对于普通人而言，我们需要对“AI 无所不能”这件事多一层清醒的认知。这不是要引发恐慌，而是理解这个趋势正在加速到来。

如果你是开发者或技术人员，现在就应该将安全加固提上日程，而不是等到问题发生后再去补救。一家公司打造出了可能是史上最强的模型，却选择先把它“关在笼子里”供防守方研究，这件事本身，或许比任何性能评测的分数都更值得深思。

当创造者开始敬畏自己的造物时，往往意味着游戏规则真的已经改变了。

这场关于 AI 能力与安全的讨论，正是我们作为开发者需要持续关注和参与的前沿议题。