你是否经常遇到这种情况:打开Claude Code,兴致勃勃地讲述产品构思,起初AI给出的代码颇有条理,但随着对话轮次增加、上下文窗口被填满,后续的回复质量便开始急剧下滑——逻辑重复、细节丢失,甚至输出残缺的桩代码(stub code)。
这正是业界常说的“上下文腐烂”(Context Rot)现象,它堪称AI编码工具的隐形杀手,往往迫使开发者最终仍需亲自动手修补代码。
今天介绍的开源工具 get-shit-done (简称GSD),正是为了解决这一问题而生。它是一个专为 Claude Code 、OpenCode、Gemini CLI 和 Codex 设计的轻量级元提示、上下文工程与规范驱动开发系统。其核心理念是让AI告别靠直觉“瞎猜”(vibe coding)的模式,转而严格按照你的需求,一步步将构想变为现实。

GSD 解决了什么核心痛点?
尽管Claude等大模型的上下文窗口可达200K tokens,但当历史对话塞满后,模型容易出现“遗忘”或“错误总结”的情况,导致后续生成的代码遗漏早期约束、风格漂移或质量下降。
传统的规范驱动(spec-driven)工具要么过于复杂像企业级Scrum,要么缺乏宏观理解。GSD则反其道而行,将复杂性隐藏在系统背后,用户只需操作几个简单命令。它的核心机制包括:
- 上下文工程:每个执行任务都使用全新的200K上下文窗口,避免历史“垃圾”污染。
- 子代理编排:研究员、规划师、执行器、验证器等角色并行协作,自动完成研究、规划和校验。
- 规范驱动:从想法到路线图,再到阶段分解,每一步都有文档锁定你的真实意图。
结果是:你只需描述一次需求,后续AI便能严格执行,并附带自动验证,彻底杜绝上下文腐烂。作者在项目自述中直言,GSD是为“想造东西的人”设计的,它将复杂性交给系统,开发者只需关注“要什么”。
一行命令快速安装
上手门槛极低。在终端中执行以下命令即可:
npx get-shit-done-cc@latest
安装器会引导你完成两个选择:
- 选择运行时(Claude Code、OpenCode、Gemini、Codex 或全部安装)。
- 选择安装范围(全局安装或本地项目安装)。
全局安装后,在 Claude Code 中输入 /gsd:help 即可验证成功(OpenCode 使用 /gsd-help,Codex 使用 $gsd-help)。更新同样使用 npx get-shit-done-cc@latest。
对于非交互式场景(如Docker、CI),也支持命令行参数安装:
# Claude Code 全局安装
npx get-shit-done-cc --claude --global
# Claude Code 本地安装
npx get-shit-done-cc --claude --local
安装完成后,项目目录下会生成一个 .planning/ 文件夹,用于存放所有状态文档。
核心工作流:六步闭环
GSD 的精髓在于 分阶段 与 纯净上下文。项目被拆分为多个里程碑(Milestone),每个里程碑又细分为多个阶段(Phase)。每个阶段都严格遵循以下六步闭环流程:
-
/gsd:new-project —— 项目初始化
系统通过一系列问答彻底理解你的目标、约束和技术偏好,随后自动进行领域研究、提取需求并生成路线图。你只需审核批准。
输出:PROJECT.md, REQUIREMENTS.md, ROADMAP.md, STATE.md。
-
/gsd:discuss-phase N —— 细化阶段偏好
这是关键步骤。系统会根据阶段类型,询问你关于布局、交互、错误处理等具体偏好,并生成 CONTEXT.md 文件。后续的研究员和规划师都会依据此文件工作,确保AI的理解无限接近你脑中的蓝图。
-
/gsd:plan-phase N —— 研究、规划与校验
四位研究员(技术栈、特性、架构、潜在问题)并行开工,生成 RESEARCH.md。接着,规划师将需求拆解为2-3个原子任务,并由计划检查器(plan-checker)进行验证(最多循环3次)。最新版本还引入了 Nyquist Validation,自动为每个需求生成测试契约,确保执行前就有验证机制。
-
/gsd:execute-phase N —— 并行执行
任务根据依赖关系分组为“波次”(wave),同一波次内的计划并行执行(每个执行器都使用全新的200K上下文)。每个任务完成后会独立提交(commit),保持清晰的Git历史。执行完毕后还有自动验证器对照阶段目标进行检查。
-
/gsd:verify-work N —— 人工验收(UAT)
系统列出可验收项供你逐一测试。若发现不符,它会自动生成调试代理和修复计划,你只需再次执行即可,无需手动调试。
-
/gsd:audit-milestone 与 /gsd:complete-milestone —— 审计与收尾
检查所有需求是否被覆盖、是否存在桩代码。确认无误后归档并打上标签,进入下一个里程碑。
整个流程可以简化为以下Markdown图示:
NEW PROJECT
↓
/gsd:discuss-phase → /gsd:plan-phase → /gsd:execute-phase → /gsd:verify-work
↓ (为每个Phase重复此循环)
AUDIT → COMPLETE → NEW MILESTONE
对于已有代码库(Brownfield 项目),可先运行 /gsd:map-codebase,系统会自动分析并生成 STACK.md、ARCHITECTURE.md 等文档,随后在初始化新项目时只关注新增需求。
常用命令速查
核心工作流命令:
/gsd:new-project —— 启动新项目
/gsd:discuss-phase [N] —— 锁定阶段偏好
/gsd:plan-phase [N] —— 生成执行计划
/gsd:execute-phase <N> —— 执行阶段任务
/gsd:verify-work [N] —— 人工验证工作
/gsd:audit-milestone —— 审计里程碑
/gsd:complete-milestone —— 完成里程碑并打标签
/gsd:new-milestone [name] —— 创建新里程碑
导航与工具命令:
/gsd:progress —— 查看当前进度
/gsd:resume-work —— 恢复工作上下文
/gsd:quick —— 处理快速小任务(修复Bug非常好用)
/gsd:debug [desc] —— 系统化调试
/gsd:settings —— 调整配置
配置自定义:满足不同场景
所有配置都保存在 .planning/config.json 中,可通过 /gsd:settings 修改。
关键参数包括:
mode:interactive(默认,步步确认)或 yolo(全自动)。
granularity:coarse(粗)、standard(标准)、fine(细)。
model_profile:quality(重度使用Opus)、balanced(平衡)、budget(节省成本,使用Haiku/Sonnet)。
workflow.nyquist_validation:开启或关闭自动测试覆盖生成。
例如,想要快速构建原型,可以将研究、计划检查等环节关闭,将粒度设为coarse,模型配置设为budget,几分钟就能完成一个阶段。
实战演练:构建一个Todo App
假设你要构建一个带登录功能的Todo应用。
-
安装与初始化
npx get-shit-done-cc@latest
在Claude Code中输入 /gsd:new-project,回答相关问题,系统会生成包含多个阶段(如用户系统、任务CRUD、UI、API、测试)的路线图。
-
讨论第一阶段
输入 /gsd:discuss-phase 1,系统会询问登录页的布局、错误提示方式等细节,并生成 CONTEXT.md。
-
规划
输入 /gsd:plan-phase 1,研究员并行调研身份验证库和UI组件,规划师输出原子任务计划,检查器验证后生成 PLAN.md。
-
执行
输入 /gsd:execute-phase 1,任务分组并行执行,自动提交代码,验证器进行检查。
-
验证
输入 /gsd:verify-work 1,根据系统提示测试功能,反馈问题后将自动生成修复。
循环后续阶段,最后使用 /gsd:audit-milestone 和 /gsd:complete-milestone 完成项目。整个过程将产生干净的Git历史、统一的代码风格和齐全的测试覆盖。
GSD如何保障输出质量?
其核心在于 上下文工程。PROJECT.md 始终被加载,RESEARCH.md 提供领域知识,CONTEXT.md 锁定用户偏好。每个执行器(executor)只获取当前阶段所需的精准上下文,完全不受历史阶段干扰。
结合 Nyquist Validation(自动生成测试契约)和波浪式并行执行,基本杜绝了桩代码、功能遗漏和风格漂移。配置中的计划检查循环确保计划与需求100%对齐,验证器(verifier)再次把关,人类仅在最后一步进行验收确认。
这套系统将“AI写代码”转变为“AI按照你的规范交付可验证的产品”。作为一款专注于解决实际问题的 开源系统,GSD 非常适合追求效率、厌恶复杂流程的Solo开发者或希望用AI提效的工程师。它通过严谨的流程设计,让开发者能够真正信赖AI生成的代码质量。
如果你也受困于上下文腐烂问题,不妨访问 云栈社区 的开发者板块,获取更多关于AI编程和工程化实践的最新讨论与资源,从今天开始,让AI助手成为你可靠的专业团队。