4083 积分	0 好友	531 主题

发消息

Anthropic Fable 5 翻车实录：安全护栏越界与后台降智引发的信任危机

发表于 2026-6-12 22:13:11 | 查看: 101| 回复: 0

这几天 Anthropic 终于放出了与最强模型 Mythos 同源的 Fable，让不少人既兴奋又焦虑。线下座谈、直播前后，不断有人来问：是不是又被 OpenAI 甩开了？国内模型还有没有追赶的机会？

结果，昨天开发圈里讨论最多的，是 Anthropic 变得太傲慢、太不诚实。

开发者先抱怨 Fable 5 的安全护栏过于粗暴：一些看起来毫无恶意的生物学、化学或网络安全问题都可能被直接拦截，比如问个 DNA 合成的原理，模型就直接叫停。更要命的是，模型会在自己判定为“高风险”的领域，悄悄回退到能力更弱的 Opus 4.8，而且压根不会告诉你“后台模型已经换了”。这种做法直接动摇的是用户对它的基本信任。

这里引出一个真正致命的问题：一家公司做出了当前最强的 AI，它有没有资格替所有人决定，这个 AI 到底该怎么用？

首先必须承认，Anthropic 这次的新模型确实强。
Fable 5 在处理长程、复杂任务上又有巨大提升。这里的“长程”不是单次对话变长那么简单，而是模型能像脑力劳动者一样，把一个复杂工作拆解开，自己一步步往前推。
而且我认为，现在大家看到的“领先”，很可能还是被低估了。
为什么？因为目前根本没有一套真正能衡量模型解决复杂现实问题能力的标准。这就像给自动驾驶出一张试卷，根本测不出真实水平。它到底行不行，只能放到真实路上去跑。现实世界的问题往往没有标准答案，复杂任务也不是一道单纯的数学题。
Anthropic 这次真正的领先，不只是跑分高，而是模型的行为能力、执行能力、解决开放式问题的能力开始发生突变了。

问题也就随之而来。
Anthropic 给模型加了安全阀门——你问到某些问题，它就给你降智，甚至不让你用到完整能力。他们也许会觉得自己做得挺负责任：“我是为了社会安全。”
但我想问一句：凭什么？
你做出了最强模型，所以你就能替全世界决定什么问题能问、什么不能问？这不是单纯的技术问题，而是权力问题。
我不是说 Anthropic 是坏人，他们或许真是一片好心。可历史上太多问题恰恰就是因为这一类“我觉得我比你更懂，所以我替你决定”的所谓好心而造成的。这就是精英主义式的傲慢，用现在的话说——“爹味”太冲了。
你现在是屠龙少年，大家愿意信你。可当你真正握住了权力之后，你会不会变成恶龙？你自己说不会，谁又能信？

Anthropic 接下来越强，这种争议只会越大。当它还不够强的时候，大家讨论的是性能；可当它强到能替人干活、替人决策的时候，所有人讨论的，就必然会是边界与权力。
这其实也是一件好事，因为它恰恰证明，Agent 的时代离我们越来越近了。
对于这种技术权力与信任边界的拉扯，在云栈社区上，不少开发者也在持续讨论。

上一篇：大疆Avata 360的全景攻势：一款无人机何以定义新赛道？
下一篇：ERC-7730 描述符安全审计指南：流程详解与核心工具实操

Anthropic, Fable5, AI安全, Agent, 大模型

Anthropic Fable 5 翻车实录：安全护栏越界与后台降智引发的信任危机

相关帖子