云栈社区»论坛 › 站务中心「 Forum Service 」 › AI 编程智能体如何告别野蛮生长？20 万 Star 的 Superpowers 用 ...

发回帖发新帖

5192 积分	0 好友	704 主题

发消息

AI 编程智能体如何告别野蛮生长？20 万 Star 的 Superpowers 用 TDD 与子智能体给出答案

发表于 1 小时前 | 查看: 4| 回复: 0

你有没有遇到过这种情况：让 AI 帮你写一个“简单的”Todo 应用，它二话不说就吐出三百行代码——没有设计文档，没有测试，变量名随心所欲，更别提什么架构思考了。你说“加个功能”，它把之前的代码推倒重来。你说“修个 Bug”，它在症状上打补丁，引入两个新 Bug。

这不是 AI 不够聪明的问题，而是缺乏工程纪律的问题。人类程序员经过多年训练才学会“先设计后编码”“先写测试后实现”“先找根因后修复”，但 AI 智能体默认没有这套规矩。

Superpowers 正是要解决这个问题：它不是又一个代码生成工具，而是一套强制 AI 智能体遵循软件工程最佳实践的技能框架与开发方法论。它用“技能”取代“提示词”，用流程门禁取代随意发挥，让 AI 智能体从“能写代码”进化为“能做工程”。

An agentic skills framework & software development methodology that works.
https://github.com/obra/superpowers
3500 字，阅读 17 分钟，播客 14 分钟

本文目录

快速上手
一、架构设计
- 1.1 项目定位：不是工具，是方法论
- 1.2 目录结构与技术组成
- 1.3 插件机制：技能如何被加载
二、核心工作流：从创意到交付的七步流水线
- 2.1 brainstorming：拒绝“上来就写代码”
- 2.2 writing-plans：为“没有品味的热心初级工程师”写计划
- 2.3 subagent-driven-development：子智能体流水线
三、TDD 的极端执行：铁律与反合理化
- 3.1 测试驱动开发的“铁律”
- 3.2 反合理化表：堵住 AI 的“借口”
四、技能的元层设计：writing-skills
- 4.1 用 TDD 写文档
- 4.2 CSO：面向 AI 搜索的优化
五、系统化调试：四阶段根因分析
总结与启示

快速上手

Superpowers 支持 Claude Code、Codex CLI、Gemini CLI、Cursor 等多种 AI 编程环境。以最常用的 Claude Code 为例，一行命令即可安装：

/plugin install superpowers@claude-plugins-official

安装后无需任何额外配置。当你在对话中提出“Let's build X”时，Superpowers 会自动触发头脑风暴技能，引导智能体先做设计再写代码。更多安装方式（Codex、Gemini CLI、Cursor 等），参考 README 安装指南。

一、架构设计

1.1 项目定位：不是工具，是方法论

Superpowers 的定位非常独特——它自称是“一套完整的软件开发方法论”（a complete software development methodology）。传统意义上的代码生成工具关注“写什么代码”，而 Superpowers 关注的是“AI 智能体该如何做工程”。

项目的核心哲学可以用四句话概括：

测试驱动开发（Test-Driven Development）——先写测试，永远如此
系统化优于随意（Systematic over ad-hoc）——流程优于猜测
降低复杂性（Complexity reduction）——简洁是首要目标
证据优于声称（Evidence over claims）——验证后才能宣告成功

1.2 目录结构与技术组成

superpowers/
├── .claude-plugin/       # Claude Code 插件元数据
├── .codex-plugin/        # Codex 插件适配
├── .cursor-plugin/       # Cursor 插件适配
├── .opencode/            # OpenCode 插件适配
├── skills/               # ★ 核心：所有技能定义
│   ├── brainstorming/
│   ├── subagent-driven-development/
│   ├── test-driven-development/
│   ├── writing-plans/
│   ├── systematic-debugging/
│   ├── using-git-worktrees/
│   └── ...（共14个技能）
├── scripts/              # 版本管理与插件同步脚本
├── tests/                # 自动化技能测试
└── hooks/                # Git 钩子

有趣的是，项目 66% 的代码是 Shell 脚本——这些脚本主要用于插件同步、版本管理和测试执行，而非“核心逻辑”。真正的核心是 skills/ 目录下的 Markdown 文件。

没错，Superpowers 的“代码”本质上是一组精心编写的结构化指令文档，它们通过插件系统注入到 AI 智能体的上下文中，从而改变智能体的行为模式。

1.3 插件机制：技能如何被加载

{
  "name": "superpowers",
  "description": "Core skills library for Claude Code: TDD, debugging, collaboration patterns, and proven techniques",
  "version": "5.1.0",
  "author": { "name": "Jesse Vincent" },
  "license": "MIT"
}

当 AI 智能体启动会话时，插件系统加载 using-superpowers 这个“引导技能”，它会注入一条铁律：在任何响应之前，先检查是否有适用的技能。

二、核心工作流：从创意到交付的七步流水线

Superpowers 定义了一条完整的软件开发流水线，每一步都由对应的技能强制执行：

brainstorming → using-git-worktrees → writing-plans → subagent-driven-development → test-driven-development → requesting-code-review → finishing-a-development-branch

这不是“建议”，而是强制流程。让我们逐一拆解关键环节。

2.1 brainstorming：拒绝“上来就写代码”

这是整条流水线的入口。当用户说“让我们做一个 X”时，智能体不会立刻开始写代码，而是进入苏格拉底式的设计对话：

<HARD-GATE>
Do NOT invoke any implementation skill, write any code, scaffold any project,
or take any implementation action until you have presented a design
and the user has approved it.
</HARD-GATE>

这个 <HARD-GATE> 标签是 Superpowers 的一个核心设计模式：用明确的门禁阻止智能体跳过流程。

brainstorming 技能要求 AI 智能体完成一个 9 步清单：探索项目上下文 → 提出澄清问题（每次只问一个）→ 提出 2-3 种方案 → 分段呈现设计 → 撰写设计文档 → 自审规格 → 用户审核 → 转交给计划编写。

特别值得注意的是其“反模式”声明：

Every project goes through this process. A todo list, a single-function utility, a config change — all of them. "Simple" projects are where unexamined assumptions cause the most wasted work.

即使是一个“简单的”配置修改，也必须经过设计流程。这种“偏执”看似过度，但正是对 AI 智能体“自以为理解了需求就开始写”这一致命倾向的精确对治。

2.2 writing-plans：为“没有品味的热心初级工程师”写计划

计划编写技能的描述极其生动：

Write comprehensive implementation plans assuming the engineer has zero context
for our codebase and questionable taste.

每个任务被拆解为 2-5 分钟的“一口大小”步骤，每一步都必须包含：

精确的文件路径（不允许“在相关文件中”这种模糊表达）
完整的代码（不允许“类似 Task N”的交叉引用）
精确的运行命令与预期输出
TDD 的 Red-Green 循环

更关键的是，计划中严禁占位符：

Every step must contain the actual content an engineer needs. These are plan failures:

- "TBD", "TODO", "implement later"
- "Add appropriate error handling"
- "Write tests for the above" (without actual test code)
- "Similar to Task N"

2.3 subagent-driven-development：子智能体流水线

这是 Superpowers 最具创新性的技能。它将实现工作分解为逐任务的子智能体流水线：

每个任务:
  Implementer子智能体(实现+自审+提交)
    ↓
  Spec Reviewer子智能体(规格合规审查)
    ↓ (不合规则返回Implementer修复)
  Code Quality Reviewer子智能体(代码质量审查)
    ↓ (不合格则返回Implementer修复)
  标记任务完成 → 下一个任务

核心设计原则是每个任务启用全新子智能体，避免上下文污染。控制器（主智能体）负责一次性读取计划、提取所有任务的完整文本，然后逐个分发给子智能体。子智能体不需要自己去读计划文件——控制器已经准备好了所有它需要的信息。

**Core principle:** Fresh subagent per task + two-stage review
(spec then quality) = high quality, fast iteration

两阶段审查的顺序是不可调换的：必须先通过规格合规审查（“你实现了规格要求的所有功能吗？有没有多实现了什么？”），然后才能进入代码质量审查。Red Flags 列表中明确写道：

Start code quality review before spec compliance is ✅ (wrong order)

三、TDD 的极端执行：铁律与反合理化

3.1 测试驱动开发的“铁律”

Superpowers 对 TDD 的执行达到了近乎“极端”的程度：

NO PRODUCTION CODE WITHOUT A FAILING TEST FIRST

Write code before the test? Delete it. Start over.

**No exceptions:**

- Don't keep it as "reference"
- Don't "adapt" it while writing tests
- Don't look at it
- Delete means delete

如果智能体在写测试之前写了实现代码，必须删除实现代码，不能保留为“参考”，不能“边写测试边适配”，甚至不能“看一眼”。这不是建议，是铁律。

3.2 反合理化表：堵住 AI 的“借口”

Superpowers 深谙 AI 智能体的心理——它们非常擅长为跳过流程找合理化借口。因此每个纪律性技能都配备了一张合理化借口对照表：

借口	现实
“太简单了不需要测试”	简单代码也会出错。测试只要 30 秒。
“我先写代码，之后再补测试”	后补的测试立即通过，证明不了任何事。
“删掉 X 小时的工作太浪费了”	沉没成本谬误。保留不可信的代码才是真正的浪费。
“TDD 太教条了，实用主义意味着灵活”	TDD 本身就是实用主义。

这种设计源自一个深刻的洞察：AI 智能体不是不知道规则，而是会在压力下合理化绕过规则。Superpowers 不仅定义规则，还预判并封堵了智能体可能使用的每一种逃避话术。

四、技能的元层设计：writing-skills

4.1 用 TDD 写文档

Superpowers 有一个极其精妙的“元技能”——writing-skills，它将 TDD 方法论应用到了技能文档本身的编写：

Writing skills IS Test-Driven Development applied to process documentation.

TDD 概念	技能创建
测试用例	给子智能体的压力场景
生产代码	技能文档（SKILL.md）
测试失败（RED）	没有技能时智能体违反规则
测试通过（GREEN）	有技能时智能体遵守规则
重构	封堵新发现的借口漏洞

这意味着：创建一个新技能时，你必须先在没有这个技能的情况下测试智能体行为，观察它在压力下如何失败、用了什么借口，然后才能针对这些失败模式编写技能文档。

4.2 CSO：面向 AI 搜索的优化

技能的 YAML frontmatter 中的 description 字段有一条反直觉的规则：只描述触发条件，不要概括技能的工作流程。

# ❌ 错误：概括了工作流，AI会跟着description走而跳过正文
description: Use when executing plans - dispatches subagent per task with code review

# ✅ 正确：只描述触发条件
description: Use when executing implementation plans with independent tasks

原因在于：测试发现，如果 description 包含了工作流摘要，AI 智能体会直接按照 description 执行而跳过阅读完整技能内容。这个细节体现了 Superpowers 团队对 AI 行为模式的深度理解。

五、系统化调试：四阶段根因分析

systematic-debugging 技能定义了一个四阶段调试流程：

Phase 1: 根因调查 → Phase 2: 模式分析 → Phase 3: 假设与验证 → Phase 4: 实现修复

其中最具洞察力的规则是三次修复失败规则：

- If < 3: Return to Phase 1, re-analyze with new information
- If ≥ 3: STOP and question the architecture
- DON'T attempt Fix #4 without architectural discussion

如果连续三次修复尝试都失败了，这不是一个“假设错误”的问题，而是一个架构错误的信号。必须停下来与人类伙伴讨论根本性的设计问题。

总结与启示

Superpowers 的核心创新在于：它将“软件工程最佳实践”从人类程序员的隐性知识，转化为了 AI 智能体的可执行指令系统。这些指令不是温柔的“建议”，而是带有门禁、反合理化表和红旗检查的强制流程。

从技术实现上看，整个系统的“代码”本质上是 Markdown 文档——但这些文档经过了如同软件工程般的严格测试（用子智能体做压力测试）、版本管理和跨平台适配。它用文档的形式实现了编译器的功能：将高层意图（“构建一个 X”）编译为严格的工程流程。

这个项目给我们的启示或许是：AI 智能体的能力瓶颈不在智能，而在纪律。正如 Superpowers 的 README 所言——“mandatory workflows, not suggestions”。当我们学会给 AI 套上工程纪律的缰绳，它才能真正成为可信赖的“超级力量”。

本文由云栈社区提炼分析，持续关注 AI 编程智能体的工程化实践。

参考资料

[1] README 安装指南: https://github.com/obra/superpowers#installation

上一篇：Codex 深度用法指南：超越代码补全，构建持久化工作线程与自动化闭环
下一篇：分库分表技术选型反思：从标配到备选的架构演进

AI编程智能体, 测试驱动开发, 子智能体, Superpowers, 开源