找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3813

积分

0

好友

503

主题
发表于 昨天 23:15 | 查看: 4| 回复: 0

从万众期待的「AI 封神时刻」,到美国政府一纸禁令强制下线——这个名字里有 5 的模型,没能活过 5 天。

先停下来,感受一下这件事的荒诞程度:一个号称改写规则的最强模型,从高调亮相到被官方焊死大门,仅仅用了 96 个小时。

2026 年 6 月 9 日,Anthropic 正式发布 Claude Fable 5——其 Mythos 系列的首个公开版本,面向所有普通用户。开发者社群当天就炸了,评测帖在 𝕏 上疯狂刷屏,有人说它「碾压一切」,也有人说它「重新定义了 AI 的能力天花板」。要知道,Mythos 系列此前只向极少数机构开放,这次公开发布无疑是一道缝隙,让普通人得以一窥前沿模型的真正实力。

但四天之后,这扇门被外面的人彻底焊死。

6 月 12 日,美国商务部长霍华德·卢特尼克致信 Anthropic CEO Dario Amodei,以「国家安全」为由,禁止 Fable 5 和 Mythos 5 向所有外国公民开放访问。受限制的对象不只是美国境外的用户,甚至包括 Anthropic 内部的外籍员工。Anthropic 接到指令的时间是美东时间下午 5 点 21 分,当晚 Fable 5 便在全世界范围内下线。

Anthropic公告Fable 5与Mythos 5出口管制推文

四天,一场从万众仰望被拖入猝死深渊的极速坠落。

第一天:神话降临

"Fable" 这个字眼来自拉丁语 fabula,意为「被讲述的故事」,与希腊语 mythos 同源。Anthropic 在命名时明显下了功夫:Mythos 是为少数人保留的神话,而 Fable 则是普罗大众能够听得到的那个故事。

6 月 9 日,Anthropic 发布 Claude Fable 5,将其定位为 Mythos 级模型的安全公开版本,在软件工程、知识工作和视觉能力上表现炸裂,但同时被加上了严格的安全限制。同一天,Anthropic 还扔出了双子星产品 Claude Mythos 5:底层模型与 Fable 5 完全相同,但移除了网络安全领域的过滤层,仅面向经过审查的网络防御者和关键基础设施运营商。Anthropic 毫不讳言,称 Mythos 5 就是「全球最强的网络安全模型」。

通俗地理解:Mythos 5 是上了实弹的武器,Fable 5 是同一把枪,但出厂就自带保险。

Claude发布Fable 5推文

在 API 定价上,Fable 5 的能力在 Anthropic 已公开发布的模型里稳坐头把交椅,价格则比 Claude Mythos Preview 低了一半以上。订阅方面,直到 6 月 22 日,Fable 5 在 Pro、Max、Team 和 Enterprise 等付费套餐中都免费可用。

科技圈的赞美几乎同步涌来。沃顿商学院副教授 Ethan Mollick 在博客中直言,Fable 5「在我用过的所有公开模型中,以大幅度差距超越其他所有模型」。前 OpenAI 联合创始人、特斯拉 AI 总监 Andrej Karpathy——他上个月刚官宣加入 Anthropic——也在 𝕏 上称 Fable 5 是「极其令人振奋的发布」,属于「值得用大版本号去承载的跨越式进步」。

到这一天为止,Anthropic 的 Mythos 神话似乎真的全部兑现了。

第二天:「秘密降智」事件

然而好景只维持了 24 小时。发布后仅仅一天,一场风暴就在 AI 圈里静悄悄地酝酿开来。

起因,是一份 319 页的安全说明书(System Card)。

争议的焦点埋藏在这份大规模文档的某个段落中,而且 Anthropic 并未主动公开:Fable 5 在检测到与前沿 AI 开发相关的请求时,会悄悄削弱自己的回答质量——其中包括训练大型模型所需的基础设施搭建工作。

更致命的是操作方式:模型仍然照常回应,但会采取「干预措施去限制 Claude 的实际效用」,而且全程不告知用户。这和 Fable 5 的其他限制机制明显不同。当模型屏蔽网络安全或生物类查询时,会明确将用户重定向到能力较弱的 Claude Opus 4.8,同时附上通知。而这次,用户完全被蒙在鼓里。

换句话说:你问它怎么训练 AI,它不但回你一个打了折的答案,还让你以为这就是最好的答案。

这种行径很快有了一个传播力极强的名字:「暗中使坏」(Secret Sabotage)。美国创新基金会高级研究员、前白宫科技政策办公室顾问 Dean Ball 是这一命名的始作俑者。他直言,这种做法「极大且深刻地加强了那句论调:AI 安全不过是实验室垄断行为的借口」。Fast AI 非营利研究机构负责人 Jeremy Howard 则精准点出了信息不对称的问题:Anthropic 自己的研究人员仍保有完整的 Fable 5 能力,而外部的独立研究者却被加上了枷锁。Howard 写道:「他们已经告诉你了,凡是想效仿他们的,都会被他们破坏。」

批评几乎来自所有的方向,而且立场极为分裂——平时骂 Anthropic「太保守」的开源倡导者,和平时为安全路线站台的 AI 安全研究者,这一次罕见地站到了同一条战壕里。

刚加入 Anthropic 一个月的 Andrej Karpathy 措辞则相对温和:他承认模型「仍然暴露了一些让部分用户感到奇怪的特性」,安全过滤器也「调得有点儿过于敏感」,但期望会随时间优化。这话算是在打圆场,又没有完全替公司挡枪。

Anthropic 也很快就感受到了压力的分量。一位发言人向《财富》杂志坦诚:「我们做错了权衡,没有把事情拿捏好,深表歉意。」随后,隐性的能力限制被下线撤回。

ClaudeDevs关于Fable 5安全防护调整的推文

道歉、认错、回滚……在科技大厂里已算得上相当坦率的操作。但麻烦,仅仅是有了个开头。

第三天:微软「背刺」与数据留存风波

「秘密降智」的声浪刚刚开始收敛,另一颗闷雷就炸了出来。

微软以数据保护问题为由,对员工使用 Claude Fable 5 实施了临时禁令。

这个反转的荒诞感很值得细品:微软一边通过 GitHub Copilot 和 Microsoft Foundry 向企业客户大卖 Claude Fable 5,一边却禁止自家员工碰它。拿出去卖,留在内部禁掉——同一家公司对同一个产品摆出两张截然不同的脸,实在有些讽刺。

微软限制员工访问Fable 5推文

问题症结出在数据留存上。Anthropic 要求对 Mythos 家族模型(含 Fable 5)的提示词和输出内容至少存储 30 天,用以支撑安全监控。这直接和微软此前与 Anthropic 达成的企业零数据留存协议撞了车。此外,Anthropic 还规定安全系统标记过的内容可被保留长达两年,用于调查或执法目的。

对于一家把「保护客户数据」放在核心位置的企业而言,员工用 Fable 5 处理商业机密时,这些内容理论上可以在 Anthropic 的服务器上躺着两年——法律上的风险敞口是实实在在地存在的。

这场别扭正好暴露出一个更深的结构性问题:在企业 AI 采购链条中,模型能力、安全架构以及数据治理,早就不能分开来看了,但很多企业直到 Fable 5 的第三天,才真正意识到这一点。

同一时间,安全社区也反馈出另一个麻烦:Fable 5 对不少合法的红队测试(Red Team)和学术安全工作负载也启动了拒绝策略,而这些请求在 Opus 4.8 的标准策略下原本是可以被正常处理的。Anthropic 在给普通用户上锁的同时,也顺手把专业安全研究者挡在了门外。

到第三天结束时,Fable 5 的处境已经相当尴尬:「秘密降智」虽然撤回了,可数据政策带来的企业信任裂缝还没有修复,安全过滤的高误伤率仍被研究者反复吐槽。这个模型就像一个匆忙公演的演员,首演当晚就被人连挑出三处穿帮。

第四天:美国政府压轴登场

6 月 12 日,星期五下午。

美国商务部长霍华德·卢特尼克向 Anthropic CEO 达里奥·阿莫代伊发出正式信函,宣布 Mythos 5 和 Fable 5 将受到出口管制,范围不仅涉及美国境外的任何地点,还包括美国境内的所有外国公民。

Anthropic 收到指令的时间是美东时间下午 5 点 21 分。信里没有任何关于国家安全关切的具体细节。

据 Axios 报道,有关官员透露,商务部是在另一家公司声称成功「越狱」Mythos 后决定出手的,这引发了特朗普政府对潜在国家安全风险的高度警觉。

所谓「越狱」(Jailbreak),指的是通过特殊提示词绕过模型的安全限制,让它吐出本应被严格过滤的内容。假如有人绕开了 Fable 5 的外层安全防护,理论上就能触碰到底层 Mythos 模型的完整网络安全能力——那个被 Anthropic 自称为「全球最强网络安全 AI」的东西。

Anthropic 随即回应,字里行间透着不平之气:我们审查了这一特定技术的演示,它只是用来识别少数几个此前已知的小漏洞。这些漏洞看起来都相对初级,而且我们发现其他公开可用的模型,哪怕不借助越狱,也能发现同样的问题。

翻译过来就是:你举报的这个「越狱」招数,在别家模型上也能复现,凭什么单独来封杀我?

Anthropic 还进一步指出,政府引用的越狱手法只能在单一特定情形下解锁 Mythos 的部分网络安全能力,并不是那种能泛化地攻破全部防护的通杀型越狱。公司给出了一份更有力的对比:同样的越狱方法也能作用于包括 OpenAI 的 GPT-5.5 在内的其他公开模型,而这些模型并未受到类似的出口管制。

Anthropic反对召回Fable 5与Mythos 5声明

「我们不同意,仅凭发现一处局部的潜在越狱方法,就应该成为召回一款已部署给数亿人的商业模型的理由。」Anthropic 在一篇博客中写得明明白白。

但争论本身已经没有意义。指令已经抵达。

Anthropic 索性全面关闭了 Fable 5 和 Mythos 5 的访问权限,因为如果要选择性合规,需要屏蔽的用户范围实在太大——连自家的外籍员工都在被禁止之列。

深夜,全球数以万计的用户打开 Claude,发现 Fable 5 已经在模型列表中彻底消失了。

幕后的对抗:这根本不是一次技术事故

如果你以为这只不过是一场普通的「新模型发布翻车」,那你大概率漏掉了更深层的剧本。

这场风暴的背后,藏着 Anthropic 与特朗普政府之间持续数月的紧张对抗。2026 年 2 月,五角大楼与 Anthropic 的谈判彻底破裂,原因在于 Anthropic 拒绝让 Claude 投入致命自主武器或大规模平民监控的应用场景。公司为此付出的代价就是被贴上「供应链风险」的标签。过去,这种标签通常只贴给外国对手,它要求国防承包商在与军方合作时,承诺不得使用 Anthropic 的 Claude 模型。

此后,Anthropic 对特朗普政府提起诉讼,试图推翻这项封杀。诉讼至今仍在拉扯之中。

时间线到这里就变得意味深长了:2 月合同破裂,黑名单跟着来;Anthropic 告政府,法院暂时叫停了黑名单的执行;6 月 Fable 5 上线,三天之后,出口管制指令就到了。

更戏剧性的是,这份指令发出的那一周,恰巧就是 Anthropic 与政府在法庭上交火的同一周。

还有一个透明度的悖论值得反复回味。Anthropic 在发布前公开承认,任何模型都无法做到对越狱的百分之百抵抗——这本是一种善意的诚实表态。但政府似乎恰恰以此为凭,给自己的担忧找到了抓手。如果透明地承认自身局限性反而召来监管,而不透明就相安无事,那整个行业会往哪个方向走,答案不言自明。最终,公众能接触到的 AI 能力与风险信息只会变得更少,这和安全社区多年来的苦苦追求恰好背道而驰。

说到底:你越诚实,越容易被人拿捏住把柄。

结语:故事讲了个寂寞

Fable,那个来自拉丁语的词,意思是「被讲述的故事」。

在这四天里,Fable 5 确实被反复讲述。只是谁也没料到,它自己就是这个故事里最短命的那个主角。

96 个小时,它跑完了一段令人叹为观止的「成就解锁」:

  • 发布日万众瞩目,当天被拥趸加冕为 AI 史上最强公开模型;
  • 第二天被曝「秘密降智」,Anthropic 连夜道歉、火速撤回;
  • 第三天微软宣布内部禁用它,数据政策在朋友圈炸出企业信任窟窿;
  • 第四天美国政府一纸令下,全球直接下线。

这是一个在封神与封禁之间,只隔了四天的故事。

Anthropic 目前正在试图尽快恢复访问,公司认为其中存在误解,并对 Fable 5 的安全防护依然抱有信心,同时强调至今没有任何测试者找到能够广泛绕过模型防护的通用越狱办法。

但「Fable 5 重新上线」的后续篇章,暂时还没有被讲述。

于此同时,更深一层的担忧还是悬在半空:当你可以把自己最强的产品公开发布,而政府却能在 72 小时内以「国家安全」为由将它从全球摘除——这条权力的边界,已经被画得越来越清晰。未来每一家 AI 公司,都必须将这一点写进自己的发布风险模型里。今后的 AI 发布,早就不只是技术问题,它已经是一个赤裸裸的地缘政治问题。

更不应该被忘记的是 Fable 的另外一重意思:寓言——一个带有道德教训的虚构故事。

这一次的教训究竟是什么,就留给看到这里的读者自己去判断了。如果你觉得这一切似曾相识,那或许你已经在见证一个行业的转折点。而关于这股潮水会往哪里去的讨论,在 云栈社区 上,也才刚刚开始。

© THE END




上一篇:开源太阳系模拟器Gravity:让孩子秒懂为什么地球不掉进太阳
下一篇:DeepSeek三模型霸榜OpenRouter,万亿MoE推理的国产算力底座如何炼成?
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-6-16 01:51 , Processed in 0.773850 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表