今天,Anthropic AI 官方发布消息,宣布完成了新一轮300亿美元的巨额融资,公司估值达到了3800亿美元。

在这笔巨额融资的背后,一个关键的产品战略逐渐清晰:Claude Skills。Anthropic 将 Skills 定位为连接 MCP 与终端用户的知识层,旨在构建一个完整的智能体生态。为此,他们正式发布了完整的构建指南 《The Complete Guide to Building Skills for Claude》。

一、Skills 的本质:给 Claude 的“说明书”
1.1 什么是 Skill?
根据官方定义,Skill 是一个包含指令的文件夹。它的核心作用是教会 Claude 如何处理某个特定的任务或工作流。这改变了以往每次对话都需要重新解释偏好、流程和领域知识的模式,让你能够“教 Claude 一次,处处受益”。
核心文件结构如下:

关键设计原则:渐进式披露
| 层级 |
内容 |
加载时机 |
| 第一层级 |
YAML 前置元数据 |
始终加载到 Claude 的系统提示中 |
| 第二层级 |
SKILL.md 正文 |
Claude 判断该技能与当前任务相关时加载 |
| 第三层级 |
链接文件(如 scripts, references) |
Claude 按需导航和发现 |
这种设计最大限度地减少了 Token 的使用,同时又保持了专业化的处理能力。
二、MCP + Skills:厨房与菜谱的类比
2.1 官方厨房类比
Anthropic 用一个精妙的类比解释了 MCP 与 Skills 的关系:
MCP 提供专业厨房:工具、食材和设备的访问权限。
Skills 提供菜谱:创建特定成果的逐步指令。

这张图清晰地展示了 MCP 作为“连接层”负责对接各类服务,而 Skills 作为“知识层”则告诉 Claude 如何有效地使用这些服务。
2.2 为什么这对 MCP 用户至关重要?
没有 Skills 时:
- 用户连接了 MCP 后,往往不知道该用它具体做什么。
- 技术支持工单里充满了“如何用你们的集成做 X?”这类问题。
- 每次对话都几乎从零开始,导致结果不一致。
- 用户可能会抱怨连接器不好用,而实际问题其实是缺少工作流指导。
有了 Skills 后:
- 预构建的工作流能在需要时自动激活。
- 确保了工具使用的一致性和可靠性。
- 将最佳实践嵌入到每一次交互中。
- 显著降低了集成与使用的学习曲线。
三、三大应用场景:从文档生成到 MCP 增强
3.1 场景一:文档与资产创建
用途:创建一致、高质量的输出,包括文档、演示文稿、应用、设计、代码等。
真实案例:frontend-design skill
“创建具有高品质设计的独特、生产级前端界面。用于构建 Web 组件、页面、工件、海报或应用。”
关键技术:
- 嵌入样式指南和品牌标准。
- 通过模板结构确保输出一致。
- 最终确定前的质量检查清单。
- 无需外部工具,充分利用 Claude 的内置能力。
3.2 场景二:工作流自动化
用途:适用于受益于一致方法论的多步骤流程,包括跨多个 MCP 服务器的协调。
真实案例:skill-creator skill
“创建新技能的交互式指南。引导用户完成用例定义、前置元数据生成、指令编写和测试。”
关键技术:
- 包含验证环节的分步工作流。
- 针对常见结构提供模板。
- 内置审查和改进建议。
- 迭代优化循环。
3.3 场景三:MCP 增强
用途:增强那些需要访问 MCP 服务器工具的工作流指导。
真实案例:sentry-code-review skill (来自 Sentry)
“使用 Sentry 的错误监控数据通过其 MCP 服务器自动分析和修复 GitHub Pull Request 中检测到的错误。”
关键技术:
- 按顺序协调多个 MCP 调用。
- 嵌入领域专业知识。
- 提供用户原本需要手动指定的上下文。
- 针对常见 MCP 问题的错误处理机制。
四、技术实现:构建你的第一个 Skill
标准文件结构如下:

4.1 YAML 前置元数据:最关键的部分
前置元数据是 Claude 决定是否加载你技能的主要依据,它是 渐进式披露的第一层级,至关重要。
最小必需格式:
---
name: your-skill-name
description: What it does. Use when user asks to [specific phrases].
---

字段要求详解:

描述字段怎么写,直接决定了你的 Skill 会不会被正确触发。
优秀描述示例: 具体且包含明确的触发词。

4.2 编写有效指令
推荐的结构模板如下:
---
name: your-skill
description: [你的描述]
---
# 你的技能名称
## 指令
### 步骤 1:[第一个主要步骤]
清晰解释该步骤做什么。
示例:
```bash
python scripts/fetch_data.py --project-id PROJECT_ID
(根据需要添加更多步骤)
## 五、五种核心设计模式
### 5.1 模式一:顺序工作流编排
**适用场景**:用户需要按特定顺序执行的多步骤流程。
**示例**:新客户入职工作流。
| 步骤 | MCP 调用 | 参数/等待条件 |
| :--- | :--- | :--- |
| 1. 创建账户 | `create_customer` | name, email, company |
| 2. 设置支付 | `setup_payment_method` | 等待支付方式验证 |
| 3. 创建订阅 | `create_subscription` | plan_id, customer_id (来自步骤1) |
| 4. 发送欢迎邮件 | `send_email` | welcome_email_template |
**关键技术**:
* 显式的步骤排序。
* 步骤间的依赖关系管理。
* 每个阶段的验证机制。
* 失败时的回滚指令。
### 5.2 模式二:多 MCP 协调
**适用场景**:工作流需要跨越多个服务。
**示例**:设计到开发交接。
| 阶段 | MCP | 操作 |
| :--- | :--- | :--- |
| **阶段 1:设计导出** | Figma MCP | 1. 从 Figma 导出设计资源<br>2. 生成设计规范<br>3. 创建资源清单 |
| **阶段 2:资源存储** | Drive MCP | 1. 在 Drive 创建项目文件夹<br>2. 上传所有资源<br>3. 生成可共享链接 |
| **阶段 3:任务创建** | Linear MCP | 1. 创建开发任务<br>2. 将资源链接附加到任务<br>3. 分配给工程团队 |
| **阶段 4:通知** | Slack MCP | 1. 在 #engineering 发布交接摘要<br>2. 包含资源链接和任务引用 |
### 5.3 模式三:迭代优化
**适用场景**:输出质量需要通过多次迭代来提升。
**示例**:报告生成。
1. **初始草稿**:获取数据 → 生成初稿 → 保存到临时文件。
2. **质量检查**:运行验证脚本 → 识别问题(如缺失章节、格式不一致、数据错误)。
3. **优化循环**:解决每个问题 → 重新生成受影响章节 → 重新验证 → 重复直到达到质量阈值。
4. **最终确定**:应用最终格式 → 生成摘要 → 保存最终版本。
### 5.4 模式四:上下文感知工具选择
**适用场景**:实现相同的结果,但根据具体上下文选择不同的工具。
**示例**:智能文件存储决策树。
* 大文件(>10MB):使用云存储 MCP。
* 协作文档:使用 Notion/Docs MCP。
* 代码文件:使用 GitHub MCP。
* 临时文件:使用本地存储。
### 5.5 模式五:领域特定智能
**适用场景**:技能不仅提供工具访问,还融入了超越工具本身的领域专业知识。
**示例**:金融合规支付处理。
* **处理前(合规检查)**:获取交易详情 → 应用合规规则(检查制裁名单、验证司法管辖区、评估风险)→ 记录合规决策。
* **处理中**:如果合规通过,则调用支付处理 MCP 工具;否则,创建合规案例供人工审查。
* **审计追踪**:记录所有合规检查和处理决策,并生成审计报告。
## 六、测试与迭代:确保技能质量
### 6.1 三层测试方法
| 测试类型 | 目标 | 方法 |
| :--- | :--- | :--- |
| **触发测试** | 确保技能在正确的时间加载 | 测试明显任务、请求的不同表述,确保无关主题不会触发。 |
| **功能测试** | 验证技能能产生正确的输出 | 验证输出内容、API 调用是否成功、错误处理是否得当、边缘情况。 |
| **性能对比** | 证明技能确实改善了使用效果 | 对比有/无技能时的 Token 消耗、工具调用次数、任务成功率。 |
### 6.2 成功指标
**定量指标:**
* 技能在 90% 的相关查询上成功触发。
* 在规定的 X 次工具调用内完成工作流。
* 每次工作流中,失败的 API 调用次数为 0。
**定性指标:**
* 用户无需一步步提示 Claude 下一步该做什么。
* 工作流无需用户手动纠正即可顺利完成。
* 不同会话之间的处理结果保持一致。
### 6.3 迭代信号与解决方案
| 信号 | 含义 | 解决方案 |
| :--- | :--- | :--- |
| **触发不足** | 技能该加载时不加载 | 在描述中添加更多细节和同义词,包括技术术语。 |
| **过度触发** | 技能为无关的查询加载 | 在描述中添加负面触发条件,使定义更具体。 |
| **执行问题** | 结果不一致、API 调用失败 | 改进指令的清晰度,添加更完善的错误处理逻辑。 |
## 结语
这份指南为我们揭示了 **Claude** 从“能做什么”到“应该如何做”的关键进化路径——**Skills**。通过将业务知识、工作流规范和最佳实践封装为可复用的技能,企业和开发者能够极大地提升 **AI Agent** 的自动化水平和专业能力。
核心要点在于理解 Skills 作为“知识层”与 MCP 的“连接层”之间的互补关系,并熟练运用五种核心设计模式来解决实际场景中的问题。从清晰的 YAML 元数据定义,到结构化的指令编写,再到严谨的测试迭代流程,每一步都决定了最终技能的可用性和可靠性。
对于希望深度应用 **人工智能** 能力的团队而言,掌握 Skill 的开发与设计,无异于掌握了构建高效、智能工作流的“菜谱”。如果你想进一步探讨如何将这些模式应用到你的具体业务中,或者寻找更多相关的 **技术文档** 和案例,欢迎来 **云栈社区** 与大家一起交流。
---
*官方指南下载地址:* https://resources.anthropic.com/hubfs/The-Complete-Guide-to-Building-Skill-for-Claude.pdf?hsLang=en