4248 积分	0 好友	556 主题

大模型1M上下文实战：Agent变蠢怎么办？试试/compact重试法

发表于 3 小时前 | 查看: 5| 回复: 0

你是否也有这种感觉：现在许多大模型都宣称支持 1M（百万） 级别的超长上下文，可一旦把对话历史堆到 10 万 token，它就开始犯迷糊；超过 20 万，错误率直线上升。本以为上下文越长越聪明，结果却是“越长越蠢”，让人哭笑不得。

其实，这背后并不是模型“智商”真的塌了，而是注意力在超长序列中被摊薄了，关键信息淹没在了庞大的背景噪音里。

那当我们在使用 Agent（比如 codex、Claude Code）干正事时，遇到它开始“神志不清”怎么办？这里有一个简单粗暴但很有效的方法：及时回退，主动精简。

具体操作可以分成两步：

果断 Rewind（回退）
一旦发现 Agent 的输出质量崩坏、逻辑混乱或者忘记你刚才的指令，不要犹豫，直接回退到它变傻之前的那一步。
执行 /compact（上下文压缩）
回退之后，马上用 /compact 对当前的对话摘要进行压缩。这里的关键是，在压缩摘要里要明确点名重点——把当前任务最核心的目标、正在调试的代码范围、已经确认的部分都清晰地概括出来，而不是让它自己自动化地随意总结。然后再继续你的下一步工作。

你会发现，就这么一个小动作，Agent 的“智商”瞬间又回来了，恢复了对细节和上下文的理解力。

为什么这招管用？因为 /compact 本质上是一次有目标的信息蒸馏。你帮它把漫无边际的聊天记录“脱水”，只把最相关的逻辑线索留下，模型自然能重新聚焦。

所以，别被“1M 上下文”的纸面参数迷惑了。在日常深度协作中，学会管理上下文，往往比追求极限长度更能保证产出质量。

如果你也在超长上下文的泥潭里挣扎过，不妨试试这一招。

更多关于 Agent 的高阶玩法与避坑指南，欢迎常来云栈社区逛逛。