在2024年和2025年,开发者们经历了一场开发工具的革命。从GitHub Copilot到Cursor,再到Claude Code,我们已经习惯了通过自然语言来生成代码。然而,随着项目规模扩大,一个尴尬的现象开始浮现:AI带来的加速度正在衰减。
为什么会出现这种情况?因为传统的软件开发模式本质上是线性的。你解决了一个Bug,写了一个新功能,代码库确实在增长,但复杂度也随之攀升。在传统模式里,开发新功能往往意味着对旧有代码的妥协和迁就。
在AI辅助开发中,如果我们仅仅把AI当作一个更快的“打字机”,那么我们只是在以更高的效率制造“遗留代码(Legacy Code)”。每一次对话结束后,AI对项目的理解(Context)通常会随着会话窗口关闭而重置。下一次,你不仅需要重新解释需求,还得面对上一轮AI生成的、你可能都没完全理解的代码。
Every.to发布的最新报告《Compound Engineering: The AI-native engineering philosophy》提出了“复利工程(Compound Engineering)”,其目的正是为了解决上述困境。这不仅仅是一种方法论,更是一种哲学——它探讨如何让每一次开发迭代,都成为系统智慧的积累,而不是技术债务的堆叠。它的核心理念颠覆了我们对软件资产的传统定义:代码本身不再是最重要的资产,系统对业务逻辑、设计规范和架构决策的“记忆”才是。
本文将深度拆解这一理念,探讨如何构建一个能够“自我进化”的AI开发系统。

什么是复利工程?
复利工程是一种AI原生的工程哲学。它要求我们将开发过程视为一个闭环系统,每一次迭代不仅要交付功能,更要沉淀知识。
在这个体系中,软件开发不再是简单的“编写代码”,而是由四个步骤组成的无限循环:
Plan(规划) -> Work(执行) -> Review(审查) -> Compound(复利/沉淀)
这四个词看似普通,但在Agentic AI(智能体式 AI)的加持下,被赋予了全新的含义。
在传统开发中,工程师是全能工匠。而在复利工程中,工程师的角色晋升为 “系统架构师”和“智能体指挥官”。
- 旧模式:工程师思考 -> 编写 Spec -> 工程师写代码 -> 工程师 Review -> 迭代。
- 新模式:工程师定义目标 -> 智能体规划 -> 智能体集群并发执行 -> 智能体集群多维审查 -> 系统自动沉淀知识 -> 工程师验收。
这种转变要求我们放弃对“手写每一行代码”的执念,转而专注于 如何教AI学会我们的品味(Taste)和规范。
深度拆解:复利工程的四大循环
让我们深入技术细节,看看这四个步骤是如何在实际的AI原生工作流中落地的。
第一步:Plan(规划)—— 模糊性的消亡
在AI开发中,模糊是最大的敌人。如果需求描述不清,AI会用其“幻觉”来填补空白,这往往导致灾难性的后果。
复利工程要求在写第一行代码之前,必须进行极度详尽的规划。但好消息是,这不再需要工程师耗费数小时去手动完成。
通过 workflows:brainstorm 和 workflows:plan 等指令,我们可以驱动AI完成以下工作:
- 理解需求:不仅仅是“做什么”,更要理解“为什么做”以及“有哪些约束条件”。
- 研究代码库:AI自动扫描现有项目架构,确保新功能不会破坏原有的核心逻辑。
- 外部调研:自动查阅相关框架的官方文档、业界最佳实践,甚至StackOverflow上的经典解决方案。
- 输出方案:生成一份详尽的技术规划文档,例如
PLAN.md。
这个阶段的核心产出物不是代码,而是决策。工程师的核心职责是在这个阶段介入,确认AI规划的技术路径是否正确。只要Plan是对的,后续的执行在理论上就只是一个算力问题。
第二步:Work(执行)—— 并发与隔离
这是复利工程最体现“暴力美学”的部分。
传统的开发者一次只能修改一个文件,修复一个Bug。但在Agent原生架构中,我们可以利用Git Worktree或分支技术,实现任务的并发执行。
通过 workflows:work,系统可以:
- 创建隔离环境:为每一个独立任务创建一个单独的分支或Worktree。
- 自动执行:AI根据
PLAN.md 中的方案编写和修改代码。
- 自我验证:自动运行Linter、Type Checker和单元测试。
- 进度追踪:实时监控所有并行任务的状态。
这彻底改变了我们对“开发速度”的定义。速度不再取决于你的打字速度,而取决于你能同时指挥多少个智能体并行工作。
第三步:Review(审查)—— AI审查委员会
这是质量控制的核心环节。在复利工程中,Review不再仅仅依赖可能已经疲惫的同事,而是由一个经过专门训练的AI审查委员会先行把关。
在Every的实践中, workflows:review 指令会唤起14个以上的专业Agent,每个Agent都佩戴着不同的“审查透镜”:
- Security Sentinel(安全哨兵):扫描SQL注入、权限绕过等OWASP Top 10漏洞。
- Performance Oracle(性能先知):寻找N+1查询、无效索引、潜在的内存泄漏风险。
- Data Integrity Guardian(数据完整性卫士):确保数据库事务边界正确,数据迁移脚本安全。
- Code Simplicity Reviewer(代码极简主义者):强制执行YAGNI(You Ain‘t Gonna Need It)原则,删除过度设计的代码。
- Design Sync(设计同步者):对比Figma设计稿与实际实现代码的像素级差异。
这些AI审查员不会疲倦,也不会因为人情世故而“放水”。它们会输出一份包含P1(严重)到P3(轻微)等级的详细审查报告。工程师此时只需要扮演最终的“法官”,基于报告决定代码是否合并。
第四步:Compound(复利)—— 灵魂所在
这是大多数AI工作流缺失的一环,也是“复利工程”得名的真正原因。
仅仅完成任务是不够的,我们必须让系统在每次任务后都变得更聪明。
在 workflows:compound 阶段,系统会执行以下关键操作:
- 捕获解决方案:AI刚刚解决了什么棘手问题?它是采用什么方法解决的?
- 知识结构化:将这些隐性的、存在于对话上下文中的知识(Tacit Knowledge)转化为显性的文档、规则或可复用的技能(Skill)。
- 更新系统记忆:
- 更新
CLAUDE.md:将本次开发中形成的新代码规范、最佳实践写入这个系统级的Prompt文件。
- 创建新的Skill:如果发现某个操作模式是重复性的(例如“生成数据库迁移脚本”),自动将其封装为一个可复用的Skill。
- 优化检索标签:确保这些新产生的知识,能在未来的任务中被RAG 系统准确地检索到。
随着时间的推移,你的AI队友会越来越懂你。它不会再犯同样的错误,也不再需要你反复解释“我们团队规定使用Kebab-case而不是CamelCase”。系统随着每一次开发而生长、进化,这就是复利效应的体现。
必要的信念重塑:我们要遗忘什么?
要成功实施复利工程,技术栈的升级只是表象,更具挑战性的是工程师思维模式的根本性转变。报告中也明确指出了我们需要“遗忘”的旧信念和“采纳”的新信念。
需要遗忘的旧信念
- “代码必须由人手写”
- 新现实:你的工作是交付业务价值,代码只是中间产物。只要最终代码是可维护、可测试且符合团队规范的,由谁(人或AI)编写并不重要。
- “每一行代码都需要人工审查”
- 新现实:这是传统开发流程的瓶颈。对于常规的业务逻辑和代码风格,应信任自动化的Agent审查体系。人类工程师的精力应集中在审查关键的架构决策和高风险的核心逻辑上。
- “第一次尝试就必须是完美的”
- 新现实:AI生成的边际成本极低。即使AI写出了95%的无用代码,只要我们有高效的机制能快速筛选、合并那5%的精华代码,整个过程在效率上依然是值得的。迭代速度远大于初始质量。
- “写代码不仅是工作,更是自我表达”
- 新现实:这对于许多开发者来说是一个痛苦的割舍。但在商业软件开发中,我们需要追求的是标准化、可维护性和团队效率。可以将自我表达的欲望留在个人业余项目或更高层次的系统架构设计中,而不是纠结于具体的实现细节编码风格。
需要采纳的新信念
- “将你的品味(Taste)提取到系统中”
- 你对代码的审美、对架构的洁癖,不应该只存在于你的脑子里,而应该变成
CLAUDE.md 中的规则,变成ESLint或RuboCop的配置文件,变成指导Agent行为的System Prompt。
- “50/50 法则”
- 未来高效工程师的时间分配应该是:50%用于规划(Planning)和知识沉淀(Compounding),另外50%用于执行(Implementation)。而在过去,这个比例可能是10%的规划和90%的埋头编码。
- “环境必须是Agent-Native的”
- 如果一个任务(例如运行测试套件、查看实时日志、对UI进行截屏对比)人类能做但AI智能体无法完成,那么这就是当前开发环境架构上的一个缺陷。必须为AI智能体提供全套的CLI工具和API接口,使其能像人类一样自如操作。
进阶实战:不仅是代码
复利工程的威力不仅限于后端或算法开发,它正在渗透到软件产品生产的每一个环节。
Vibe Coding 与设计
对于前端和UI/UX设计领域,报告提出了 “The Baby App Approach”(婴儿应用法) 。
与其在庞大且复杂的主代码库中小心翼翼地修改UI组件,不如让Agent快速生成一个独立的、可抛弃的微型原型应用(Baby App)。
在这个沙盒环境中,你可以通过自然语言进行极速的设计迭代(Vibe Coding),直到对交互和视觉效果完全满意为止。然后,再通过专门的Design Agents从这个原型中提取出成型的设计系统(色彩、间距、组件模式等),并将其系统性地应用回主代码库。
这种方法彻底解决了“在遗留系统上雕花”所带来的风险和负担,让界面创新和实验的成本趋近于零。
用户研究与角色模拟
传统的用户研究耗时耗力。在复利工程框架下,我们可以创建“角色智能体(Persona Agents)”。
将过往的用户访谈记录、通过Descript等工具转录的会议文本“喂”给AI,训练出能代表典型用户的Agent(例如“工作繁忙、注重效率的营销经理Sarah”)。
在开发一个新功能时,可以先让“Sarah Agent”进行模拟试用并提供反馈:“这个仪表盘数据堆砌太多了,我每天早上只有5分钟时间查看,这些信息对我没有直接帮助。”
这将产品反馈循环从几周(等待真实用户测试)缩短到几分钟。
市场与文档
- 文案Agent:可以学习你过往所有的博客文章、产品文档和市场材料,精准掌握你的品牌语调和写作风格。
- 更新日志Agent:可以监控Git提交记录,自动生成清晰、有价值的产品发布说明。
关键在于,这些都不是简单的文本生成,而是基于“复利”的知识沉淀——它们知道哪些新增功能是用户真正关心的,哪些改动只是底层的技术重构,从而写出真正对用户有价值的文档。
如何开始?成熟度模型
实施复利工程不可能一蹴而就。Every的报告提出了一个从0到5的成熟度模型,你可以借此进行自查和定位:
- Stage 0: 手工开发
- 纯手写代码,StackOverflow是主要帮手。
- Stage 1: 基于聊天的辅助
- 使用ChatGPT或Claude网页版,通过复制粘贴来获取代码片段。效率有所提升,但开发上下文是割裂的。
- Stage 2: 逐行审查的Agent工具
- 使用Cursor Composer或Claude Code等工具。AI可以读取文件、直接修改代码,但人类仍需像保姆一样盯着AI的每一步操作。这是目前大多数早期采用者所处的阶段。
- Stage 3: 计划优先,PR级审查
- 这是关键的跃迁点。人类只参与最初的任务规划(Planning)和最终的Pull Request Review。中间的代码编写、修改过程完全由AI自主完成。团队开始有意识地建立
CLAUDE.md等知识沉淀机制。
- Stage 4: 从想法到PR
- AI能够自主进行功能调研、技术规划、代码执行和自我审查。人类工程师只需要给出一个相对模糊的想法或需求描述。
- Stage 5: 云端并发执行
- 脱离本地开发环境,AI智能体在云端的沙箱环境中并发运行。你或许正喝着咖啡,手机上就陆续收到了多个已完成功能的PR合并通知。
你的首要目标,应该是尽快从Stage 2跨越到Stage 3。
小结:拥抱从量变到质变的飞跃
复利工程的核心,不在于某个具体的Prompt技巧或某个酷炫的工具,而在于“积累”二字。
在传统开发模式中,随着项目生命周期变长、代码库老化,开发速度下降几乎是必然的(软件熵增定律)。
但在复利工程范式中,随着可复用Skill的积累、CLAUDE.md的不断完善、自动化测试覆盖率的持续提升,整体的开发速度是可以实现加速的。你的系统越庞大,AI可用的“知识积木”就越多,它构建新功能的速度反而会越快。
这是一种反直觉的体验,也是AI原生时代带给工程师和团队的最大红利。
正如报告中所总结的:“Ship more value. Type less code.”(交付更多价值,少敲代码。)
这不仅仅是一个美好愿景,更是每一位希望在AI时代保持竞争力的软件工程师必须了解和探索的必经之路。在云栈社区这样的开发者社区中,我们可以持续交流这类前沿的工程实践,共同进化。
开始行动吧,别让你的代码库只有“技术债务”,而没有“知识复利”。
参考资料:https://every.to/guides/compound-engineering