最近看到 Claude Code 核心团队分享的一个设计原则,深得我心!
“渐进式批录”,就是说:别一次性把所有信息塞给 agent,让它按需获取、逐层展开。
何意??
1. 先说上下文
早期 Claude Code 也用 RAG——建索引,检索片段,塞进上下文。为何后面却砍了呢?
很简单,你替 agent 决定它该看什么,不如让它自己去找。Claude 知道自己缺什么,它自己搜到的东西,才能真正接上它的推理链。你塞进去的,它是被动接收的,理解深度完全不一样。
现在的 Skills 机制就是这个逻辑:只给 agent 看每个 skill 的名字和描述,它觉得需要了,再自己去加载完整内容,递归展开,按需深入。
2. 再说工具数量
团队对新增工具卡得极严,官方大概只有二十个工具。
为什么?每多一个工具,模型每次推理就多一个选项要权衡,出错概率随之上升。
因此后面改用子代理。只有用户问相关问题时才启动,找到答案就返回,不把原始文档全量塞进上下文,从而最大化保留会话模型的能力!
3. 这个和我们日常使用有什么关联?
如果你在用 Claude Code,CLAUDE.md 就是你能控制的系统提示词,别写成两千行的操作手册。
它可以是总约束、系统级规则,或者其他 L1 顶层范式。
详细规范独立成文件,路径留在 .md 里,留一个索引,让 Claude 需要时自己去读。
提问也一样,别把你觉得相关的所有文件全贴进去,给方向,给入口索引,节省上下文的同时还能充分发挥模型能力。
团队最后说了一句话:给 agent 设计工具,是科学,也是艺术。你塞得越多,它越受限;你给得越克制,它发挥得反而越好。
对于 Agent 设计,你有哪些心得?欢迎来 云栈社区 聊聊。
|