找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3891

积分

0

好友

517

主题
发表于 3 小时前 | 查看: 4| 回复: 0

循环工程开发场景:程序员通过Claude Code编排多代理工作流

循环工程(loop engineering)——即设计自动化代理工作流程,不再手动发送提示词——正重塑2026年开发者使用Claude Code与OpenAI Codex的方式。

本周AI开发者工具圈最火的讨论,始于一份新的职位描述。

Anthropic公司Claude Code的负责人Boris Cherny表示,他不再直接向Claude发出指令,“我现在的工作就是写循环”。同时,Peter Steinberger也呼吁开发者开始为AI代理设计循环。

X平台用户Avid发布的推文截图,引述Boris Cherny关于不再提示Claude、只写循环的发言

上周日,谷歌软件工程师Addy Osmani发文将这种模式命名为循环工程(loop engineering)

名称本身并不重要,重要的是它揭示的趋势:编码代理正从交互式助手演变为长时间运行的执行系统。OpenAI和Anthropic花费数月时间,陆续发布了循环所需的六个基本构建模块。

从机器操作到生产线设计

Boris Cherny将循环工程定义为“取代自己,成为提示智能体的人”。其核心是一种编排模式,结合了定时执行、隔离工作区、验证智能体和持久化内存,将编码代理转变为自主软件工作者。

过去两年间,与编码智能体协作需要不断键入提示,人同时扮演调度员和质量把关人。

循环模式颠覆了这种结构——最接近的类比是:从操作车床转变为设计车床所在的生产线。循环会按计划发现工作,用第二个代理验证结果,并将状态写入文件,以便明天的运行从今天中断的地方继续。它比Osmani早期提出的“线束工程”模式高一个层次。

两种产品都使用相同的基础构件

循环工程已从非正式模式进化为正式实践,因为构建模块现在都内建于产品之中,不再依赖自定义脚本。

Osmani将六个基本元素分别映射到Claude Code与Codex,映射关系几乎完全一致:

原始 Loop循环的作业 Codex Claude Code
自动化 计划性发现和分诊 自动化选项卡,包含一个分诊收件箱 计划任务、/loop钩子、GitHub Actions
工作树 隔离平行代理 每个线程内置工作树 git worktree子代理的工作树隔离
技能 将项目知识编码化 SKILL.md代理人技能 SKILL.md代理技能
连接器 联系外部工具 MCP连接器和插件 MCP服务器与插件
次级代理人 将制图者与检查者分开 子代理定义于.codex/agents/ 次级代理.claude/agents/,代理团队
记忆 运行间保持状态 AGENTS.md记忆功能,或通过连接器进行线性连接 CLAUDE.md,自动记忆,或通过MCP进行线性记忆

两款产品都提供了一个/goal命令,让智能体持续工作直到满足可验证的停止条件,其中Claude Code使用单独模型来评估结果。借助自动化功能,OpenAI使Codex用户能将计划发现作为重要特性运行;Anthropic则于4月推出了Claude Code的例程及动态工作流。

一些团队通过让Claude编写自己的编排脚本并运行并行子代理来测试动态工作流。有了这些基础功能,开发者可以将周期性维护转换为计划的自主工作流,团队通过隔离的工作树并行运行代理而不破坏主分支。当工具构建者宣布组装完成时,这样的技术栈便开始迅速传播。

验证是赢得信任的关键环节

循环中最关键的设计选择,是把编写代码的代理与检查代码的代理分开。模型自行评估输出过于宽松,因此需要第二个持有不同指令的代理来捕获第一个代理自身推理所产生的Bug。

Anthropic在其针对长时间运行代理的框架工作中详细描述了这种分离型方法。

在Osmani的实践里,早晨的自动化流程会对前一天的CI失败进行分类,然后派遣一个子代理在独立工作树中为每个失败编写修复方案,同时派出另一个子代理根据项目测试用例进行审查。

Ramp的Inspect六个月前就构建了这种定制化基础设施,如今它作为第一方功能被两个生态系统采用,表明闭环运行正在成为默认模式。

成本、正确性和理解债务

有意思的是,开发者在不到18个月的时间里,从即时工程到上下文工程,再到利用工程,最终演进到循环工程。

2026年的循环调度层使用的是传统调度器(例如cron)。中间的决策逻辑则将二者区别开来:cron作业运行固定脚本,而循环运行的是一个模型,该模型读取当前状态并选择下一步操作。

Osmani比他所引发的讨论更为谨慎。他警告开发者,Token成本差异巨大,无人值守的循环运行也意味着无人值守的错误。他最严厉的警告是关于“理解债务”——当系统发布你从未阅读过的代码时,理解鸿沟就会扩大。两个软件工程师运行相同的循环,可能得到截然相反的结果:一个在理解代码的前提下工作效率更高,另一个则完全回避理解。

前路漫漫

开发者可以从一个定时分诊自动化流程和一个验证子代理入手,以极少的Token投入获取最大价值。

当前,Cursor、Google的Antigravity和GitHub的新应用Copilot都支持代理编排,但目前还没有哪个应用将循环作为其工作单元。这些平台之间的关键区别在于从模型本身转向围绕模型的循环,因为调度、验证和内存现在决定了最终交付的内容。

循环工程有望成为AI辅助软件开发的编排层,而能够使循环定义可移植的技术供应商将占据领先地位。




上一篇:WWDC 2026深度解析:Apple Intelligence如何重构Siri AI与系统底层Agent框架
下一篇:AI冲击下零售SSD市场几近消失,慧荣称2027年NAND短缺将更糟
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-6-18 03:46 , Processed in 0.630413 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表