离大谱
Anthropic 天天鼓吹AI威胁论,把自家模型吹上天,没想到狼真的来了,不过此狼非彼狼,刚发布 Claude Fable 5 几天,就被按死了。
被按死的理由可能真的是太过强大,不便公开。

我测试也感觉,强是真强,贵是真贵:# Anthropic 最强大模型 Claude Fable 5 实测,问了俩问题,花了 90 元
Anthropic 为了合规,只能对全球所有用户一刀切,大家都别玩了。
目前我的 Clopilot 的 model 列表已经没有 Claude Fable 5 了:

Claude Fable 5 我还嫌贵,没怎么体验,有点后悔了。
回顾一下:

Claude Fable 5 Mythos 5 风波时间线
- 4 月初:Anthropic 发布 Mythos 预览版(Claude Mythos Preview),称其“发现软件漏洞的能力过强,不能公开发布”,只给 Amazon、Apple、Google、Microsoft、CrowdStrike 等约 50 家做防御性安全的机构,这个项目叫 Project Glasswing。
- 4 月 21 日:Sam Altman 上 Core Memory 播客阴阳怪气:“这是绝佳的营销——‘我们造了颗炸弹,准备砸你头上,再卖你一个 1 亿美元的防空炸弹避难所’”——他给这套打法起名叫“恐惧营销”(fear-based marketing)。
- 6 月 9 日:Anthropic 正式发布 Claude Fable 5(带护栏的公众版)和 Claude Mythos 5(无护栏的精英版),声称这是当前公开可用的最强模型。
- 6 月 12 日:Anthropic 宣布对 全球所有用户 直接关停这两个模型——其他模型不受影响。
Anthropic 官方给的 Fable 5 和 Mythos 5 的能力对比图,几乎屠榜:

Fable 5 和 Mythos 5 与其他主流模型能力对比
Mythos 5 和 Fable 5 其实是 同一个底层模型,只是后者多套了几层护栏(classifiers)。
| 维度 |
Claude Mythos 5 |
Claude Fable 5 |
| 底层 |
同一个 Mythos 级模型 |
同一个 Mythos 级模型 |
| 安全分类器 |
拆掉网络安全限制 |
加全套护栏 |
| 触达范围 |
仅 Glasswing 信任合作伙伴 |
全网公开发布 |
| 护栏命中率 |
不适用 |
不到 5% 会被拦下并 fallback 到 Opus 4.8 |
| 数据保留 |
强制 30 天保留 |
强制 30 天保留 |
| 价格 |
50 / M output |
同上 |
Anthropic 自己给的 Fable 5 网络安全任务上的拦截曲线,护栏直接把它的攻击进展按死在地板上:

Arena 对 Fable 5 的测评,也是各种第一:


未公开的 Mythos 5 测试结果更强,挑几条感受一下:
- Stripe(付费早测):Fable 5 把一个 5000 万行的 Ruby 代码库 全库迁移,原本团队手工要干 2 个月,模型 1 天搞定。
- Cognition FrontierCode 评测:Fable 5 是当前所有前沿模型里得分最高的,甚至在中等推理强度下也是第一。
- 视觉:之前的 Claude 玩《精灵宝可梦 火红版》要靠各种地图和工具脚手架,Fable 5 只看截图就通关了。
- 长上下文:在《杀戮尖塔》这种卡牌游戏里,给它一个文件型记忆系统,效果提升是 Opus 4.8 的 3 倍。
- 药物设计:Mythos 5 在 14 个蛋白靶点中给出 9 个有强候选;某新机制独立被另一组 E. coli 实验 反向证实。
- 基因组学:Mythos 5 自主跑了一周多,整合了 138 个物种数百万个细胞的数据,训出的小模型尺寸只有 Science 上一篇近期工作的 1/100,效果反而更好。
之前大家还在讨论 Anthropic 限制 Mythos 释放,到底是为了保护互联网,还是保护 Anthropic 自己? 真相大概率还是一场生意:“阻止其他公司用蒸馏,同时把企业级合同护城河挖深”。
现在倒好,求仁得仁了,Codex 对此的评价:这是个好事儿啊

国产模型,我常用的就俩:
- Qwen3.7-max 与 Claude4.7 掰手腕!阿里旗舰大模型 Qwen3.7-Max 来了,7个实测,很丝滑,可以在 Qdoer 中每天免费调用200次:阿里放大招,桌面端 Qoder 再进化,实测 AI 编程更强了
- DeepSeek V4 Pro
|