找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

5003

积分

0

好友

646

主题
发表于 2 小时前 | 查看: 5| 回复: 0

离大谱

Anthropic 天天鼓吹AI威胁论,把自家模型吹上天,没想到狼真的来了,不过此狼非彼狼,刚发布 Claude Fable 5 几天,就被按死了。

被按死的理由可能真的是太过强大,不便公开。

Claude 官方推文:美国政府指令暂停 Claude Fable 5 访问

我测试也感觉,强是真强,贵是真贵:# Anthropic 最强大模型 Claude Fable 5 实测,问了俩问题,花了 90 元

Anthropic 为了合规,只能对全球所有用户一刀切,大家都别玩了。

目前我的 Clopilot 的 model 列表已经没有 Claude Fable 5 了:

GitHub Copilot 模型选择界面:Claude Opus 4.8 可用,Fable 5 已消失

Claude Fable 5 我还嫌贵,没怎么体验,有点后悔了。

回顾一下:

Claude Fable 5 与 Mythos 5 风波时间线:从安全叙事到全网下架仅3个月
Claude Fable 5 Mythos 5 风波时间线

  • 4 月初:Anthropic 发布 Mythos 预览版(Claude Mythos Preview),称其“发现软件漏洞的能力过强,不能公开发布”,只给 Amazon、Apple、Google、Microsoft、CrowdStrike 等约 50 家做防御性安全的机构,这个项目叫 Project Glasswing
  • 4 月 21 日:Sam Altman 上 Core Memory 播客阴阳怪气:“这是绝佳的营销——‘我们造了颗炸弹,准备砸你头上,再卖你一个 1 亿美元的防空炸弹避难所’”——他给这套打法起名叫“恐惧营销”(fear-based marketing)。
  • 6 月 9 日:Anthropic 正式发布 Claude Fable 5(带护栏的公众版)和 Claude Mythos 5(无护栏的精英版),声称这是当前公开可用的最强模型。
  • 6 月 12 日:Anthropic 宣布对 全球所有用户 直接关停这两个模型——其他模型不受影响。

Anthropic 官方给的 Fable 5 和 Mythos 5 的能力对比图,几乎屠榜:

Fable 5 和 Mythos 5 与其他主流模型能力对比
Fable 5 和 Mythos 5 与其他主流模型能力对比

Mythos 5Fable 5 其实是 同一个底层模型,只是后者多套了几层护栏(classifiers)。

维度 Claude Mythos 5 Claude Fable 5
底层 同一个 Mythos 级模型 同一个 Mythos 级模型
安全分类器 拆掉网络安全限制 加全套护栏
触达范围 仅 Glasswing 信任合作伙伴 全网公开发布
护栏命中率 不适用 不到 5% 会被拦下并 fallback 到 Opus 4.8
数据保留 强制 30 天保留 强制 30 天保留
价格 50 / M output 同上

Anthropic 自己给的 Fable 5 网络安全任务上的拦截曲线,护栏直接把它的攻击进展按死在地板上:

Fable 5 在网络攻击任务上的护栏拦截效果

Arena 对 Fable 5 的测评,也是各种第一:

Agent Arena Leaderboard:Claude Fable 5 排名第一

Confirmed Success & Praise vs Complaint 排行榜:Fable 5 大幅领先

未公开的 Mythos 5 测试结果更强,挑几条感受一下:

  • Stripe(付费早测):Fable 5 把一个 5000 万行的 Ruby 代码库 全库迁移,原本团队手工要干 2 个月,模型 1 天搞定。
  • Cognition FrontierCode 评测:Fable 5 是当前所有前沿模型里得分最高的,甚至在中等推理强度下也是第一。
  • 视觉:之前的 Claude 玩《精灵宝可梦 火红版》要靠各种地图和工具脚手架,Fable 5 只看截图就通关了
  • 长上下文:在《杀戮尖塔》这种卡牌游戏里,给它一个文件型记忆系统,效果提升是 Opus 4.8 的 3 倍。
  • 药物设计:Mythos 5 在 14 个蛋白靶点中给出 9 个有强候选;某新机制独立被另一组 E. coli 实验 反向证实
  • 基因组学:Mythos 5 自主跑了一周多,整合了 138 个物种数百万个细胞的数据,训出的小模型尺寸只有 Science 上一篇近期工作的 1/100,效果反而更好。

之前大家还在讨论 Anthropic 限制 Mythos 释放,到底是为了保护互联网,还是保护 Anthropic 自己? 真相大概率还是一场生意:“阻止其他公司用蒸馏,同时把企业级合同护城河挖深”。

现在倒好,求仁得仁了,Codex 对此的评价:这是个好事儿啊

表情包:这是好事啊

国产模型,我常用的就俩:

  1. Qwen3.7-max 与 Claude4.7 掰手腕!阿里旗舰大模型 Qwen3.7-Max 来了,7个实测,很丝滑,可以在 Qdoer 中每天免费调用200次:阿里放大招,桌面端 Qoder 再进化,实测 AI 编程更强了
  2. DeepSeek V4 Pro



上一篇:LM317多电压电源:一个电路搞定12V、9V、6V、5V、3.3V输出
下一篇:JS-Tap实战指南:通用JavaScript武器化与客户端数据窃取
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-6-14 05:00 , Processed in 0.751101 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表