6 月 10 日凌晨,Anthropic 正式发布两款顶级大模型——Claude Fable 5 与 Claude Mythos 5。作为其当前最强的「Mythos」系列成员,这两款模型一经亮相,便迅速点燃全球开发者社区的热情。短短几小时内,社交媒体和 AI 圈几乎被同一个话题刷屏:Claude 这次又对大模型的能力边界发起了怎样的冲击?
Anthropic 官方给出的评价相当直接:Claude Fable 5 在软件工程、知识工作、视觉理解以及科研任务等多个维度,均已超越此前所有公开发布的 Claude 模型,并在绝大多数主流评测基准上跻身行业第一梯队。

一天内完成 5000 万行代码库迁移
比起冰冷的跑分数据,第一批体验者的反馈反而更快抓住了开发者的眼球。
Claude Code 之父 Boris Cherny 评价道:「Fable 5 是自去年 11 月 Opus 4.5 发布以来,最大的一次模型能力跃升。」此前 Opus 4.5 问世后,他意识到自己已连续数周全程在终端完成编程工作,干脆将 IDE 卸载。而到了 Fable 5,他的感受再度升级:Claude 不再只是一个 Coding Agent,而更像一位在产品构建中并肩作战的思考与设计伙伴。它具备了以往模型稀缺的判断力、审美观和多维度思考能力。
最让他印象深刻的是一次调试经历:面对一个复杂 Bug,Fable 5 并未急于修改代码,而是像资深工程师一样先收集数据、添加日志、验证假设,直到确认问题真正解决才宣告完成。更重要的是,这种行为并非来自 Claude Code 的特殊提示设计,而更像是模型自身内化的能力与习惯。「它身上确实有一种我此前从未感受过的东西——一种典型的“超大模型气息”。」

如果说 Boris 的评价更多源于长期使用体验,那么投资机构 Menlo Ventures 合伙人、前 Google Search 成员 Deedy Das 的反馈则更为直白。他坦言 Claude Fable 5 绝对是自己见过「最离谱」的模型之一,并第一次真切地为软件工程的未来感到担忧。随后,他整理了 Fable 5 创造的一些难以置信的壮举:
- 在一天之内,完成对 Stripe 一个 5000 万行代码库的全库迁移(人类团队通常需要两个月以上)。
- 绘制出令人惊叹的 3D 图形,涵盖波音 747 客机、包含 5000 多个对象的太空模拟、《Minecraft》过山车、完全照片级真实的森林场景、纽约天际线及暴风雨云层效果。
- 一次性通关《宝可梦 火红版》(Pokémon FireRed)。
- 针对真实世界的专有交互网求值器进行优化,性能提升 10 倍,远超竞品 GPT-5.5。

相比之下,刚刚加入 Anthropic 的 Andrej Karpathy 则把这次发布视为一次「大版本升级」式的飞跃。他认为,随着软件生产成本的持续走低,一个全新纪元正在打开——软件正变得像自来水般触手可得。人们不再仅仅让 AI 写代码,而是直接令 AI 生成解释工具、数据仪表盘、研究平台、自动化系统乃至完整应用。


Claude Fable 5 和 Mythos 5 到底是什么?
值得留意的是,Anthropic 并未将这两款模型简单区分为「大模型」与「小模型」。Claude Fable 5 与 Claude Mythos 5 采用完全一致的底层架构,核心能力持平,最大差异集中在开放权限、安全限制及使用人群三大方面——也就是哪些用户能用、怎么用、以及模型允许输出什么内容。简单来说,就是「大众安全版」与「专业无限制版」。
Claude Fable 5:面向多数人的主力旗舰
Claude Fable 5 面向普通用户、开发者与企业开放,是首款正式推向大众的 Mythos 级模型,也是 Anthropic 目前对外公开的最强通用大模型。与 Claude Mythos 5 相比,它引入了一定的限制。为规避高风险滥用,Fable 5 配备了全新的安全分类器,相当于为强能力加装了一道「安全阀门」:当用户问题触及网络安全、生物、化学等敏感领域时,模型会自动降级,切换至上一代成熟模型 Claude Opus 4.8 进行回复,从而避免释放全部高风险能力。
Claude Mythos 5:受限开放的满血旗舰
Claude Mythos 5 则算得上是「满血版」旗舰,能力与 Fable 5 完全等同,但移除了所有安全分类限制。不过,它并不对外开放,而是通过 Anthropic 的 Project Glasswing 进行定向授权,仅面向少数经过严格审核的机构,例如网络安全防御公司、关键基础设施服务商以及合规的生物医学科研团队,主要应用于漏洞挖掘与前沿科研等专业场景。Anthropic 表示,Claude Mythos 5 现阶段将依托其与美国政府合作推进的「玻璃翼计划」落地,该计划也是此前 Mythos 预览版的升级版本。在实际使用中,这意味着在部分敏感领域,Mythos 5 能直接给出答案,展现出更强能力,而 Fable 5 则会触发安全降级处理。


新模型到底强在哪?
本次迭代并非小修小补。相比旧版,Claude Fable 5 和 Mythos 5 能独立完成更长周期的任务,并在多项基准测试中几乎全面领先。

在软件工程能力上,这是企业最为关注的核心提升方向。Anthropic 指出,Fable 5 可以在更长时间内自主运行,并在更少的人工干预下完成复杂任务,这正是 AI agent 从「代码补全工具」迈向「自主执行系统」的关键一步。在 SWE-bench Pro 基准上,Fable 5 与 Mythos 5 取得了 80.3% 的成绩,显著领先于 OpenAI 最新通用模型 GPT-5.5 的 58.6%。在 Cognition 的 FrontierCode Diamond 基准测试中,两者得分为 29.3%,而 Claude Opus 4.8 为 13.4%,GPT-5.5 仅为 5.7%。

Anthropic 还强调,Fable 5 即使在「中等推理强度」下,也能在 FrontierCode 上取得领先成绩,这暗示它不一定依赖最大算力依然能输出更优的编程结果。

在落地案例中,支付公司 Stripe 的测试极富代表性。他们利用 Fable 5,在一天之内完成了对约 5000 万行 Ruby 代码库的全库级别迁移,而同样的工作通常需要一个工程团队耗费两个月以上。
在知识能力领域,Fable 5 也被定位为企业知识工作的强力工具。在 GDPval-AA 上,Fable 5 与 Mythos 5 得分为 1932,高于 Claude Opus 4.8 的 1890、GPT-5.5 的 1769 及 Gemini 3.1 Pro 的 1314。在侧重文档视觉理解的 GDPpdf 测试中,两者在无工具条件下达到 29.8%,明显优于 Opus 4.8 的 22.5%、GPT-5.5 的 24.9% 和 Gemini 3.1 Pro 的 16.7%。这类能力对企业至关重要,因为现实业务中大量信息仍以非结构化形式存在——PDF、表格、图表、报告、合同、PPT 与截图等。Fable 5 在文档推理、图表理解以及复杂问题解决方面均有显著提升。
对于视觉能力与界面理解维度,Anthropic 强调 Fable 5 是其目前最强的视觉模型。它既能从专业科学图表中提取精准数据,也能仅凭应用截图还原整套网页应用源代码,完成各类高难度视觉任务。模型对辅助工具的依赖度同样大幅降低:以往版本的 Claude 模型即便搭配专属辅助程序也难以通关《宝可梦:火红》,而 Fable 5 仅靠纯视觉识别就顺利打穿了这款游戏。

定价
定价方面,Anthropic 为 Claude Fable 5 和 Mythos 5 设定的价格均为输入 10 美元/百万 tokens,输出 50 美元/百万 tokens。这一价格虽较此前 Mythos Preview 已下降一半,但仍处于全球主流大模型定价的高位。
对开发者而言,Fable 5 已通过 Claude API 提供访问,接口名称为 claude-fable-5。该模型即日起在 API 以及按用量计费的企业套餐中全面开放。不过,订阅用户的体验规则要更复杂一些:从即日起至 6 月 22 日,Fable 5 将免费包含在 Pro、Max、Team 及按席位计费的企业套餐中;但从 6 月 23 日开始,该模型将被移出这些订阅套餐,后续若要继续使用,需消耗使用额度。Anthropic 同时表示,他们的目标是尽快让 Fable 5 重新回归标准订阅套餐,作为长期可用功能提供。

写在最后
与此同时,Anthropic 还为 Mythos 类模型引入了新的数据留存机制:Fable 5、Mythos 5 及未来同级模型,将在所有使用场景下实施 30 天数据保留要求。这些数据不会被用于训练新的 Claude 模型,也不会用于非安全目的,并将通过访问日志记录与到期删除机制进行保护,大多数情况下会在 30 天后自动清除。
整体来看,这两款模型确实代表了 Claude 当前的能力上限,性能提升非常明显,但「静默降级」的安全设计也引发了一定争议。对于开发者与 AI 爱好者而言,趁免费窗口期实际体验一番,或许是理解这一代「神话级模型」的最佳方式。这类硬核资讯与深度讨论,也持续在云栈社区的开发者圈子中发酵,不妨去围观一线实践者的真实反馈。
参考: