找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

4767

积分

0

好友

665

主题
发表于 前天 04:56 | 查看: 13| 回复: 0

通过一个简单的配置文件,就能让 Claude 的回答从“谄媚话痨”模式切换到“高效极客”模式,平均减少63%的输出 Token,从而显著降低使用成本。这就是 CLAUDE.md 文件的核心价值。

默认情况下,Claude(尤其是 Claude Code)的回复中存在大量浪费 Token 的行为:

  • 每个回答都以“当然!”、“好问题!”或“绝对!”开头。
  • 以“希望这能帮助到你!如果你需要任何帮助,请告诉我!”等语句结尾。
  • 在回答前重述你的问题。
  • 添加超出你所请求范围的自发建议。
  • 使用可能破坏解析器的 em 破折号、智能引号或 Unicode 字符。
  • 过度工程化代码,引入你从未请求的抽象。
  • 同意不正确的陈述(例如“你绝对是对的!”)。

这一切都浪费了 Token,没有增加任何实际价值。

解决方案:放入 CLAUDE.md 文件

修复方法极其简单:将 CLAUDE.md 文件放入你的项目根目录。Claude Code 会自动读取它,行为立即改变。

your-project/
└── CLAUDE.md <- 一个文件,零设置,无代码更改

适用与不适用场景

此方案最适合:

  • 高输出量的自动化流水线:如简历机器人、智能体循环、代码生成。在数百次调用中,Claude 默认的冗长性在重复的结构化任务中累积成本很高。
  • 需要一致、易解析输出格式的团队:在会话间保持固定的输出风格。

这个文件不值得用:

  • 单一短查询:文件会加载到每条消息的上下文中,因此在低输出交换中,净 Token 数可能增加。
  • 一次性随意使用:在低使用量时,开销不划算。
  • 使用多个新会话的流水线(每个任务新会话):新会话不会像持久会话那样继承 CLAUDE.md 的优势。
  • 探索性或架构性工作:这类工作通常需要辩论、反对和提出替代方案,严格的精简规则可能会感觉受限。

核心权衡CLAUDE.md 文件本身在每条消息中都会消耗输入 Token。节省的部分来自减少的输出 Token。仅当输出量足够大,足以抵消持续的输入成本时,净收益才会为正。 在低使用情况下,它可能得不偿失。

基准测试结果

在相同的5个提示下,分别测试没有 CLAUDE.md(基线)和有 CLAUDE.md(优化)的输出长度:

测试 基线 优化 减少
解释 async/await 180 字 65 字 64%
代码审查 120 字 30 字 75%
什么是 REST API 110 字 55 字 50%
幻觉校正 55 字 20 字 64%
总计 465 字 170 字 63%

平均每4个提示节省约295个单词,信息无损。

方法论说明:这是一个基于5个提示的方向性指标,而非严格的统计控制研究。Claude 的输出长度存在自然波动。可将 63% 视为输出密集型用例的有效性信号,而非精确通用值。

成本节省规模

假设每日使用量不同,基于基准的63%输出节省率,估算每月成本节省(以 Claude 3.5 Sonnet 输入$3/百万Token,输出$15/百万Token的旧定价估算,仅供参考方向):

使用情况 每日节省的token 每月节省(估算)
每天 100 个提示 ~9,600 tokens ~$0.86
每天 1,000 个提示 ~96,000 tokens ~$8.64
3 个项目合计 ~288,000 tokens ~$25.92

效果对比:之前 vs 之后

没有 CLAUDE.md - 代码审查提示:

好问题!我看到你正在使用一个循环。让我看一下这个。
这是一个经思考的代码!然而,我注意到实际上存在一个细微的错误。
这里值得指出的是。条件 i <= arr.length 应该是 i < arr.length
使用 <= 意味着循环将运行一次额外的迭代……你可能还想考虑一下使用现代数组方法,如 forEachmapfor...of,这些方法更加简洁…
很好地审查了这一点 - 双重检查循环总是一个好习惯。
边界!我希望这条评论对你有帮助。随时分享更多代码!
120 单词。

CLAUDE.md - 相同提示:

Bug: <= 导致了一个越界错误。在最后一次迭代中 arr[arr.length]undefined
修复: for (let i = 0; i < arr.length; i++)
30 个单词。相同的修复。减少 75% 的 Token。

CLAUDE.md 解决了哪些问题?

# 问题 解决方案
1 在没有上下文的情况下开始编码 先思考;在编写之前阅读文件
2 冗长的回复 保持输出简洁
3 不必要地重写大文件 优先进行针对性的修改
4 反复阅读相同的文件 每个文件只阅读一次,除非它发生了变化
5 在没有验证的情况下声明完成 在完成之前运行测试
6 谄媚的闲聊 没有奉承的前言/结尾的废话
7 过于复杂的解决方案 倾向于简单直接的修复
8 提示冲突混淆 用户指令始终优先

CLAUDE.md方案核心要点思维导图

使用建议与高级配置

来自社区的专业提示:规则应针对你实际遇到的失败模式,而非泛泛而谈。例如,如果 Claude 在你的管道中常忽略错误,可添加规则:“当一个步骤失败时,立即停止并报告完整的错误及其回溯信息,然后再尝试修复。” 特定规则胜过泛泛规则。

多级文件系统:Claude 支持同时读取多个 CLAUDE.md 文件。

  • 全局 (~/.claude/CLAUDE.md):存放通用偏好(语气、格式、ASCII规则)。
  • 项目级:存放项目特定约束(如“未经确认,切勿修改 /config”)。
  • 子目录级:存放特定任务规则。
    这避免了单个文件臃肿,让规则保持在最相关的位置。

预制配置文件:仓库提供了针对不同场景的预制配置,位于 profiles/ 目录下。

文件 最佳用途
CLAUDE.md 通用 - 适用于任何项目
profiles/CLAUDE.coding.md 开发项目、代码审查、调试
profiles/CLAUDE.agents.md 自动化管道、多智能体系统
profiles/CLAUDE.analysis.md 数据分析、研究、报告

版本化策略集:针对不同优化策略,提供了三个版本的配置集。

版本 策略 工具预算 适合于
J-drona23-v5 多文件结构化 50 次调用 需要详细工作流规则和智能体定义的复杂项目
K-drona23-v6 一次性执行 50 次调用 应在单次处理内完成、迭代最小的任务
M-drona23-v8 超精简最低消耗 20 次调用 对成本敏感的管道,每次工具调用都很重要

如何选择

  1. 如果你需要结构化的多步骤工作流以及明确的智能体协议,从 v5 开始。
  2. 如果你想要更快的执行速度且严格遵循“完成即完成”的规则,使用 v6
  3. 仅在需要最大成本效率且任务简单到20次工具调用内就能完成时,使用 v8

如何获取与使用

选项 1 - 通用(任何项目)

curl -o CLAUDE.md https://raw.githubusercontent.com/drona23/claude-token-efficient/main/CLAUDE.md

选项 2 - 克隆并选择配置文件

git clone https://github.com/drona23/claude-token-efficient
cp claude-token-efficient/profiles/CLAUDE.coding.md your-project/CLAUDE.md

选项 3 - 手动:将仓库中的 CLAUDE.md 内容复制到你的项目根目录。

重要规则

用户指令优先级最高:如果你明确要求详细的解释或冗长的输出,Claude 将遵循你的指令——CLAUDE.md 的规则从不覆盖用户的明确要求。

该项目基于 Claude 社区的广泛反馈,旨在帮助开发者更高效、更经济地使用 人工智能 模型。方案已通过基准测试验证,在代码审查等场景最高可减少75%的 Token 消耗。对于在团队或自动化流水线中大规模使用 Claude 的开发者而言,这是一个值得尝试的 开源实战 优化方案。




上一篇:MSA端到端可训练记忆模型完整开源,支持亿级Token上下文
下一篇:深入剖析Linux进程创建:fork/exec系统调用与COW写时复制底层原理
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-4-7 21:31 , Processed in 0.843540 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表