找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2909

积分

0

好友

387

主题
发表于 2 小时前 | 查看: 1| 回复: 0

最近,Claude Code 社区因为一个核心性能问题而“炸开了锅”。有用户通过分析海量会话数据,发现 Claude Code 的“思考深度”在近期更新后显著下降。这引发了大量开发者对这款热门 AI 编程工具可靠性的担忧。

今天,我们就来深度剖析这件事,用数据说话,并梳理官方的回应与临时解决方案。

数据不会说谎:深度下降的量化证据

事件的起源是 GitHub 上 Claude Code 仓库的一个 issue(编号 #42796)。

发帖人 AMD 的 AI 总监 Stella 分析了 6,852 条会话日志、17,871 个“思考块”和 234,760 次工具调用,得出了令人信服的量化结论。

思考深度:从“写论文”到“写短信”
数据显示,Claude Code 每次“思考”的平均字符数从 1 月份的基线约 2,200 个,骤降至 2 月底的约 720 个,降幅高达 67%。你可以理解为,你的 AI 助手从能进行长篇、严谨的逻辑推导,退化到了只能进行简短、表层的思考。

Claude Code 思考内容可视化与编辑比例变化表

Claude Code 思考深度中位数变化数据表

“先读后改”的工作流被打乱
在正常的编程工作流中,理解现有代码(读)是修改(写)的前提。数据表明,1 月份时,Claude Code 平均每进行 1 次文件编辑,会先进行 6.6 次文件读取。到了 2 月底,这个比例降到了 2.0。这意味着 AI 在动手修改前,用于理解代码的“功课”大幅减少。

Claude Code 阅读与编辑比例变化数据表

“盲改”比例飙升
一个更令人担忧的数据是:没有事先读取就直接进行编辑的行为比例,从 1 月份的 6.2% 飙升至 2 月底的 33.7%。在复杂的工程项目中,这种“不看就改”的行为极易引入错误,破坏代码结构。

Claude Code 未经阅读直接编辑的比例变化表

用户满意度与成本双降
用户的直接反馈体现在“打断率”上:每 1000 次工具调用中,用户手动中断 AI 行为的次数从 0.9 次激增至 11.4 次,翻了超过 12 倍。这说明用户对 AI 的输出越来越不满意,需要频繁干预。

与此同时,使用成本却急剧上升。报告显示,在用户使用量基本不变的情况下,估算的 API 调用成本从 2 月份的 345 美元暴涨至 3 月份的 42,121 美元,涨幅达 122 倍。用户花费了更多的钱,却得到了质量下降的结果。

Claude Code API 使用量与成本对比数据表

官方回应:问题出在哪里?

面对详实的数据,Anthropic 的 Claude Code 团队工程师 Boris 做出了官方回应,解释了导致问题的主要原因:

  1. Opus 4.6 的自适应思考机制(2月9日上线):该机制本意是让模型根据任务复杂度动态调整思考深度,以提升效率。但在实际执行中,模型似乎倾向于将大多数任务都判断为“简单”,从而过度削减了思考步骤。
  2. Medium Effort 默认值设为 85(3月3日更新):Claude Code 的“思考强度”(Effort)参数范围是 0(不思考)到 100(全力思考)。此次更新将默认值设置为 85,本意不低,但与上述的自适应机制结合后,产生了预料之外的负面影响。

Boris 同时澄清,UI 上的“思考内容折叠显示”(redact-thinking)功能只是界面变化,并不影响模型实际的思考过程。问题的核心在于思考的“量”而非“显示方式”。

临时解决方案:如何手动恢复性能?

官方给出了三个临时解决方案,用户可以根据自身情况选择:

方案一:手动设置高努力模式
在对话中直接输入命令:

/effort high

此命令需在每次新会话中手动输入一次。在一些第三方客户端(如 CCS)的设置中,也可以直接勾选“高强度思考”选项来全局开启。

方案二:通过环境变量禁用自适应思考
在系统环境变量中设置:

CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1

将此变量添加到你的 Shell 配置文件(如 .bashrc.zshrc)中可永久生效。这是最彻底的一劳永逸的方法。

方案三:开启思考摘要显示
在 Claude Code 的设置中启用 showThinkingSummaries: true。这不会提升思考深度,但可以让你直观看到模型“想了多少”,方便判断其是否在“偷懒”。

重要提示:根据报告作者 Stella 的实测,即使同时应用以上所有方案,思考深度大约也只能恢复到原先的十分之一水平,无法完全复原。

这件事给我们带来了哪些启示?

  1. 效率优化不能牺牲核心质量:Anthropic 的初衷是好的,希望通过智能调节来节约计算资源(Token)并提升响应速度。但在编程这类对准确性和逻辑严谨性要求极高的领域,任何对核心推理能力的削弱都可能造成灾难性后果。
  2. 成本透明度与信任危机:122 倍的成本增长极其惊人。这不仅仅是技术问题,更触及了商业信任。当用户为性能下降的服务支付巨额费用时,平台的公信力会受到严重质疑。
  3. 竞争格局可能生变:Claude Code 凭借其强大的代码能力,在过去半年占据了 AI 编程工具的领先地位。此次事件无疑给 Cursor、GitHub Copilot 等竞争对手提供了一个关键的赶超窗口期。

给不同用户的行动建议

  • Claude Code 重度用户强烈建议立即设置环境变量 CLAUDE_CODE_DISABLE_ADAPTIVE_THINKING=1,并在处理复杂任务前手动输入 /effort high。这并非可选,而是保证工作流稳定的必要措施。
  • 企业团队用户:关注 Anthropic 后续针对 Teams 和 Enterprise 版本的更新,官方已承诺将在这些版本中默认启用高努力模式。同时,评估当前项目是否需临时切换备用工具。
  • 轻度或简单任务用户:影响可能不大。自适应思考对简单的、单文件的任务优化效果尚可。
  • 正在选型的开发者:建议采取“多工具并存”策略。Claude Code 能力依然顶尖,但此次事件暴露的风险值得警惕。可以同时关注和试用其他 AI编程 工具的发展。

写在最后

这次事件是一次典型的“优化翻车”,它提醒我们,即使在 人工智能 技术日新月异的今天,任何底层模型的调整都需要经过极端谨慎的评估和测试,尤其是在面向开发者的生产力工具上。社区用户通过扎实的 数据 分析推动问题曝光和解决的过程,也体现了开源协作的力量。

你对 Claude Code 近期的使用体验如何?是否也观察到了类似的变化?欢迎在技术社区分享你的经历和看法。




上一篇:一个35岁Java程序员的自述:我用8个月转型AI架构师的真实经历
下一篇:众擎机器人获13亿元B轮融资,具身智能赛道再添百亿独角兽
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-4-10 04:37 , Processed in 0.737445 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表