一个AI模型强到连自己的创造者都害怕发布,你觉得这事儿离谱吗?
Anthropic 最近放出了 Claude Mythos 的预览版,它的各项能力全面碾压了上一代的 Opus 4.6。但耐人寻味的是,他们并没有庆祝这个技术突破,而是宣布暂时不向公众开放。
这背后,到底发生了什么?
一、能力越强,风险越高
AI 编写代码的能力越强,它发现和利用安全漏洞的能力也就越强。这就像一枚硬币的两面,你无法只取其正面。
根据公布的信息,Mythos Preview 已经发现了数千个高危漏洞,覆盖了主流的操作系统和浏览器。这意味着什么?意味着这个 AI 在发现和利用漏洞方面的水平,已经超过了绝大多数人类黑客。目前,可能只有最顶尖的那一小撮安全专家还能与之一较高下。
你每天使用的手机系统、浏览器和各种网站,在其“视野”里可能布满了潜在的风险点。更关键的是,这种能力会随着模型的迭代而持续增强,并且迟早会以某种形式被更多人掌握。
二、一次史无前例的克制
Anthropic 做了一件 AI 公司从未做过的事:主动选择不公开发布最强的模型。以往也有实验室谈论“克制”,但大家心里都明白那多半是公关话术。这次的情况截然不同。
Anthropic 启动了一个名为“玻璃翼计划”的项目,拉上了 Amazon、Apple、Google、Microsoft、NVIDIA 等行业巨头共同参与。该计划的目的只有一个:在 Mythos 正式发布之前,让这些巨头先用预览版去全面加固自己的系统。
简单来说,就是先让“防守方”进行演练,避免正式版问世时,现有的网络基础设施被轻易“打穿”。为了推动此事,他们还提供了最高 1 亿美元的使用额度,并向开源安全组织捐赠了 400 万美元。试问,哪家公司的营销活动会这样真金白银地投入?
三、从远虑到近忧:AI安全的紧迫性
过去我们讨论 AI安全,许多人觉得是科学家们在贩卖焦虑。但请设想一下,当 AI 已经能够自动挖掘出数千个高危漏洞,并且其能力在未来几个月内还将跃升至新的台阶时,情况就完全不同了。
Anthropic 自己也承认,全面加固全球的网络基础设施可能需要数年时间,但 AI 的能力跃迁可能就在几个月内发生。两者之间的时间窗口正在急速收窄。
四、这与我们每个人都有关
你使用的每一个 App、访问的每一个网站、进行的每一次在线支付,底层都运行在这些可能面临风险的系统之上。随着 AI模型 的能力不断增强,攻防之间的天平正在发生倾斜。
对于普通人而言,我们需要对“AI 无所不能”这件事多一层清醒的认知。这不是要引发恐慌,而是理解这个趋势正在加速到来。
如果你是开发者或技术人员,现在就应该将安全加固提上日程,而不是等到问题发生后再去补救。一家公司打造出了可能是史上最强的模型,却选择先把它“关在笼子里”供防守方研究,这件事本身,或许比任何性能评测的分数都更值得深思。
当创造者开始敬畏自己的造物时,往往意味着游戏规则真的已经改变了。
这场关于 AI 能力与安全的讨论,正是我们作为开发者需要持续关注和参与的前沿议题。
|