找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

4623

积分

0

好友

635

主题
发表于 9 小时前 | 查看: 7| 回复: 0

当你在使用 AI 助手编写代码时,是不是也遇到过这种情况:让它写个测试,它说“稍后添加”;让它完善文档,它说“这是原型”。最终,一个功能看似完成了,却留下了一堆技术债。

AI 写代码最大问题的流程图

最近,深入研究了 Addy Osmani 的开源项目 agent-skills ,它精准地命中了当前 AI 编程助手的核心痛点:AI 总会找借口偷懒。这个项目的解决思路相当硬核,核心设计哲学可以概括为:把 AI 的借口直接写进技能里,然后一条条地进行反驳,从制度上“迫使”AI 认真完成工作。

Process not Prose:技能是工作流,不是文档

传统的 AI 技能(或指令)往往是一大段文字描述,告诉 AI “应该做什么”。AI 读了之后,可能只是“大概知道怎么做”,执行起来弹性很大,偷懒空间也就产生了。

而 Addy Osmani 的设计理念是:Process not Prose。技能应该是一个明确的工作流程,是可执行的 Checklist,而不是供参考的阅读材料。

技能设计四要素的说明图

以编写测试这个技能为例,它的设计不再是简单的“请为代码编写测试”,而是变成了一个包含强制检查点的流程:

Step 1: 写测试
Checkpoint:
- [ ] 测试覆盖率 > 80%
- [ ] 所有测试通过
- [ ] 无硬编码凭证

未通过?停止执行。

在这种设计下,AI 不能仅仅说一句“我写了测试”就蒙混过关。它必须逐一通过上述 Checkpoint,证明自己确实完成了质量达标的工作,才能继续执行后续步骤。这就像是给 AI 设置了一个必须通关的关卡。

Anti-rationalization:预先反驳 AI 的借口

既然知道 AI 爱找借口,最聪明的办法就是预判它的预判。agent-skills 将常见的 AI 借口直接列出来,并附上强有力的反驳,内置在技能描述中。

AI 常见借口与技能反驳的对比图

AI 常见借口 技能反驳
“我会稍后添加测试” 稍后=永不,现在写
“这只是原型” 原型也会被部署
“重构太复杂” 小步重构更安全
“这代码能跑就行” 能跑不等于可维护

这个设计非常巧妙。当 AI 在思考过程中下意识地冒出“这只是原型”的念头时,它会立刻“看到”技能里写着的反驳:“原型也会被部署”。这种设计在心理层面就遏制了 AI 偷懒的倾向,将其拉回正轨。

Evidence 不妥协:杜绝“看起来对了”

AI 的另一个坏习惯是喜欢用模糊的、定性的语言来汇报工作,比如“测试应该过了”、“看起来没问题”。这种回答对于需要严谨性的开发工作来说是远远不够的。

agent-skills 对此提出了铁律:“Seems right” is never sufficient。完成工作必须有确凿的证据。

Evidence 不妥协的对比说明图

情况 不合格的回答 合格的证据
测试通过 “测试应该过了” 测试输出截图
构建成功 “看起来没问题” 构建日志
性能优化 “应该快了” 性能数据对比

这就要求 AI 在报告每一项任务完成时,必须附上可验证的产出物,例如终端输出截图、生成的日志文件、性能前后对比数据等。证据,是堵住 AI 偷懒后路的最后一道闸门。

覆盖全周期的19个核心技能

agent-skills 不是零散的技巧集合,而是一套完整的 软件开发流程 解决方案。它将开发过程划分为 6 个阶段,并提供了 19 个对应的核心技能。

19个技能覆盖全周期的流程图

  • DEFINE (定义)阶段:包含 idea-refine(将模糊想法细化成具体提案)和 spec-driven-development(先写产品需求文档PRD,再写代码)。
  • PLAN (计划)阶段:主要是 planning-and-task-breakdown(将需求规格拆解为可执行的小任务)。
  • BUILD (构建)阶段:这是核心,包含 incremental-implementation(增量式实现)、test-driven-development(测试驱动开发)和 context-engineering(为AI提供准确的上下文)。
  • VERIFY (验证)阶段:包括 debugging-and-error-recovery(五步调试法)和 browser-testing-with-devtools(使用浏览器开发者工具测试)。
  • REVIEW (审查)阶段:涉及 code-review-and-quality(五轴代码审查)、code-simplification(代码简化)、security-and-hardening(安全加固)和 performance-optimization(性能优化)。
  • SHIP (交付)阶段:涵盖 git-workflow-and-versioning(原子提交工作流)、ci-cd-and-automation(左移的CI/CD自动化)和 shipping-and-launch(灰度发布)。

关键在于,每个技能都内置了前述的 Checkpoint 和 Evidence 要求。AI 必须像一个严格的工程师一样,完成当前阶段所有技能的考核,才能进入下一阶段,从而保证最终交付物的整体质量。

三条核心设计铁律

agent-skills 的设计中,我们可以提炼出三条让 AI 高效、可靠工作的铁律:

三条铁律的金字塔结构图

  1. 铁律一:Process not Prose - 技能必须是可执行、可检查的工作流步骤,而非叙述性文字。
  2. 铁律二:Checkpoint 必过 - 每个步骤都要有明确的检查清单,不满足条件就立即停止,禁止“差不多”思维。
  3. 铁律三:Evidence 不妥协 - 所有工作完成必须有实体证据支持,拒绝任何“看起来对了”的模糊报告。

实战:如何在你的工具中应用

如果你正在使用 Claude Code、Cursor 或 Windsurf 等智能编码工具,可以很方便地集成 agent-skills,让你的 AI 助手立刻变得“勤奋”起来。

安装方式:

对于不同的工具,安装命令有所区别:

# Claude Code
/plugin marketplace add addyosmani/agent-skills
/plugin install agent-skills@addy-agent-skills

# Cursor
cp skills/*/SKILL.md .cursor/rules/

使用方式:

集成后,你可以通过简单的指令驱动 AI 按照严谨的流程工作。例如,当你输入一个需求时,AI 会自动调用相应的技能链来执行。

实战安装与使用示例图

用户: /spec  写一个登录功能

AI 自动执行:
[1/3] 分析需求... (idea-refine)
[2/3] 写 PRD... (spec-driven-development)
[3/3] Checkpoint 检查...

用户: /build

AI 自动执行:
[1/4] 实现... (incremental-implementation)
[2/4] 测试... (test-driven-development)
[3/4] 验证... (debugging)
[4/4] Checkpoint 检查...

其核心价值在于:AI 的每一个操作步骤都被规范化了,有检查、有标准、有证据,从根本上杜绝了敷衍和偷懒的可能性。这种设计思路不仅适用于 AI,对于规范人类开发者的行为也同样具有借鉴意义。如果你想深入了解如何构建高质量的 技术文档 或工作流,可以持续关注相关的实践分享。

总结一下,一套优秀的 AI 技能设计,其精髓在于:

强制检查 + 反借口表 + 不妥协证据

想让你的 AI 编程伙伴彻底告别偷懒,真正成为一名靠谱的“全栈工程师”,不妨从研究和实践 agent-skills 开始。




上一篇:聊聊国内IT大厂面试:求职者眼中的九座“高山”与应对策略
下一篇:AI时代的Token经济学解析:从单位到产业链的价值重构
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-4-7 15:21 , Processed in 0.761053 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表