Anthropic为Claude Agent引入“梦境”机制以优化持续工作表现
Anthropic PBC 近日宣布,其 AI Agent 将具备一种类似“做梦”的能力。这并非要让它休眠,而是使其能够复盘过往的交互与工作内容,识别重复错误,进而实现持续性的自我改进。
在 Code with Claude 开发者大会上公布的这项更新中,Anthropic 为其 Claude Managed Agents 新增了“梦境”功能。简单来说,就是允许 Agent 复盘近期事件,筛选出值得存储的记忆片段,用于指导未来的任务。

Managed Agents 为开发者提供了 Messages API 之外的另一种选择。Anthropic 将其描述为运行在全托管基础设施上的“预构建、可配置的 Agent 框架”,尤其适合多个 Agent 协同处理那些需要数分钟甚至数小时才能完成的项目。
“梦境”作为一种预设流程,让 Agent 能够回顾历史会话与记忆存储,从中提取行为模式,并筛选出未来可能用得上的记忆。用户可以根据需要,自定义 Agent 的“做梦”频率,并且可以选择是允许自动更新记忆,还是先由人工审核变更内容。
这项创新直接挑战了 Claude 等 大语言模型 普遍存在的上下文窗口限制。传统的基础聊天机器人通常采用“压缩”机制,只能分析单次会话,而“梦境”机制支持跨多个 Agent、跨多次会话去分析历史记录与记忆存储,真正实现了关键记忆的全局保留。这也正是 智能体 在处理长期复杂任务时所必需的能力。

Anthropic 在一篇博客中解释道:“梦境能揭示单个 Agent 无法独立发现的模式,包括重复出现的错误、日渐趋同的工作流程以及团队共享的偏好。同时,它通过记忆重组来保持信息的高信噪比,这对于长期任务和多 Agent 协同尤为重要。”
成果导向与多Agent协同
目前,“梦境”功能还处于研究预览阶段,开发者需要申请访问权限。不过,Anthropic 已将此前处于预览期的另外两项功能正式开放:
成果导向:这项功能通过提供具体示例,帮助 Agent 更清晰地理解任务目标。用户可以为每项任务创建理想成果的样本,然后由一个独立的“评分 Agent”据此来评估任务的最终输出质量。据 Anthropic 的测试显示,相比使用标准提示,这种方法能将任务成功率提升多达 10 个百分点。它特别适用于对精度要求极高的场景,或像品牌声量复制这类带有主观色彩的工作。
多Agent协同:现在支持 Managed Agents 将复杂任务分解为多个子任务。一个主导 Agent 会负责将这些子任务分派给不同的子 Agent 去执行。用户可以通过 Claude 控制台,直观地追踪查看每个子 Agent 的具体操作流程和输出结果。
上述两项功能现已在 Managed Agents 的公开测试版中上线。同时,Anthropic 还宣布,Pro 和 Max 订阅用户的使用时长限制,已从原来的 5 小时直接翻倍至 10 小时,给开发者带来了更大的发挥空间。
参考来源:
Anthropic is letting Claude agents ‘dream’ so they don’t sleep on the job
在 云栈社区,我们持续关注前沿技术动态,为你带来高质量的 技术文档 与深度解读。
|