你是否也有这种感觉:现在许多大模型都宣称支持 1M(百万) 级别的超长上下文,可一旦把对话历史堆到 10 万 token,它就开始犯迷糊;超过 20 万,错误率直线上升。本以为上下文越长越聪明,结果却是“越长越蠢”,让人哭笑不得。
其实,这背后并不是模型“智商”真的塌了,而是注意力在超长序列中被摊薄了,关键信息淹没在了庞大的背景噪音里。
那当我们在使用 Agent(比如 codex、Claude Code)干正事时,遇到它开始“神志不清”怎么办?这里有一个简单粗暴但很有效的方法:及时回退,主动精简。
具体操作可以分成两步:
-
果断 Rewind(回退)
一旦发现 Agent 的输出质量崩坏、逻辑混乱或者忘记你刚才的指令,不要犹豫,直接回退到它变傻之前的那一步。
-
执行 /compact(上下文压缩)
回退之后,马上用 /compact 对当前的对话摘要进行压缩。这里的关键是,在压缩摘要里要明确点名重点——把当前任务最核心的目标、正在调试的代码范围、已经确认的部分都清晰地概括出来,而不是让它自己自动化地随意总结。然后再继续你的下一步工作。
你会发现,就这么一个小动作,Agent 的“智商”瞬间又回来了,恢复了对细节和上下文的理解力。
为什么这招管用?因为 /compact 本质上是一次有目标的信息蒸馏。你帮它把漫无边际的聊天记录“脱水”,只把最相关的逻辑线索留下,模型自然能重新聚焦。
所以,别被“1M 上下文”的纸面参数迷惑了。在日常深度协作中,学会管理上下文,往往比追求极限长度更能保证产出质量。
如果你也在超长上下文的泥潭里挣扎过,不妨试试这一招。
更多关于 Agent 的高阶玩法与避坑指南,欢迎常来云栈社区逛逛。
|