北京时间2025年12月,Anthropic正式将Agent Skills发布为开放标准。在上次分享了MCP的探索后,这次我们迫不及待地体验了Agent Skills,看看它是否如宣传般强大。
Agent Skills是什么?
根据Anthropic官网的定义:
This led us to create Agent Skills: organized folders of instructions, scripts, and resources that agents can discover and load dynamically to perform better at specific tasks.
简单来说,Agent Skills是可被智能体动态发现和加载的、包含指令、脚本和资源的结构化文件夹。要理解Agent Skills,最好与MCP(模型上下文协议)和A2A(智能体间协作)进行对比。

引用:Anthropic 工程团队博客
一个核心结论是:Agent Skills定义“能力”,MCP提供“工具”,A2A实现“协作”。
三者对比


核心关系
你可以将这三者理解为构建一个“智能体公司”的不同部门:
- Agent Skills 像是公司的各个专业员工,他们各自掌握了完成特定任务(如写代码、做设计、分析数据)的完整方法和流程。
- MCP 像是公司的统一后勤与工具库。无论哪个员工需要工具(如使用数据库、调用API),都通过标准流程从这个库中领取。
- A2A 像是公司内部的协作通讯协议和会议制度。当复杂任务需要多个部门员工(即多个智能体)合作时,他们依据这套规则进行沟通与交付。
Agent Skills的核心优势
Agent Skills的设计思路有别于传统的MCP开发模式,其官网揭示了几个值得关注的突出特点。
特点一:渐进式披露 (Progressive Disclosure)
渐进式披露 是Agent Skills设计中的核心原则,它让智能体的技能体系既灵活又可扩展。就像一本结构清晰的说明书,先给目录,再分章节,最后附上详细附录。技能的设计也是如此,让Claude只在需要时才加载对应的信息。
当智能体具备文件系统和代码执行工具时,它无需在处理任务时一次性将所有技能内容读入上下文窗口。这意味着,一个技能所能涵盖的信息量实际上没有上限。理论上,你可以为一个Agent装备数百甚至无限个技能(从写SQL到分析数据),而它们仅占用极少的上下文(Context)空间,只在执行相关任务时才被调用。这完美解决了长期困扰开发者的Token浪费和上下文干扰问题。
特点二:LLM不是万能的,让代码做它擅长的事
大语言模型虽然强大,但有些确定性操作交给传统代码来执行显然更高效、更可靠。例如,让模型通过逐词生成来排序列表,远比直接运行排序算法的消耗大得多。除了效率,许多实际应用场景需要确定性的、可靠的结果——而这恰恰是代码的强项。
Agent Skills提出,许多具有清晰输入输出逻辑的确定性任务,可以拆解为由传统代码执行,效果甚至更好。它的优势在于,代码脚本只会在具体执行时被触发(Claude can run this script without loading either the script or the PDF into context.),而无需像传统Agent方式那样,将所有可能用到的工具描述和文档都预先塞进Prompt上下文。

引用:Anthropic 工程团队博客 - 技能在上下文窗口中被触发
实战落地:货拉拉的应用尝试
了解了理论,我们来看看如何在实战中应用。一个标准的Skill结构大致如下:

其核心是编写 SKILL.md 文件。

必需字段:
name - 技能的名字(小写字母、数字、下划线)
description - 技能功能和使用场景描述,帮助AI判断何时使用
在云栈社区的人工智能板块,我们经常探讨如何将前沿的AI能力与具体业务结合。接下来,我们将分享在货拉拉大数据场景下的两个实战案例。
实战一:自然语言查询数据
背景
在大数据分析中,存在大量如财务对账、A/B实验报告等固定场景的数据查询需求。Agent Skills 可将这些流程性的知识打包成可组合、可复用的技能。我们无需为每个业务场景单独定制一个复杂的Agent,只需让通用Agent动态加载对应的技能,就能快速解决特定领域的问题。
案例设计
我们将财务分析和A/B实验报告中的自然语言查数需求,抽象为以下通用步骤:
- 理解用户意图:识别查询目标(财务数据、实验订单数据、用户行为数据等)。
- 加载领域知识:读取对应场景的元数据表、业务术语定义等信息。
- 生成SQL逻辑:基于知识,识别应使用的数据库(如Hive、Doris)及相关SQL编写规范。
- 执行并返回结果:调用对应的脚本工具(如
hive.py & doris.py)执行查询,并格式化结果。
现在,我们将这一整套流程打包成一个 “SQL生成”技能,其目录结构设计如下:

当我们在Agent中注册这个技能后,它便具备了快速响应自然语言查数需求的能力。

财务数据查询场景

A/B实验报告查询场景
通过将自然语言查数能力技能化,各业务线的Agent不再需要重复定制查数逻辑,只需维护好自己领域的知识文档,就能快速解决查询问题。整个流程变得更加标准化,易于治理和迭代。
实战二:业务指标归因分析
背景
面对海量数据,如何快速定位核心指标波动的原因,是发挥数据价值的关键。我们利用Agent Skills封装了指标归因分析的能力。


核心流程:
- 理解用户意图:根据问题选择“核心业务指标分析”或“OLAP下钻分析”技能。
- 加载领域知识:读取技能文档(
SKILL.md),理解分析框架和可用工具。
- 解析并执行脚本:识别并调用技能包中提供的Python分析脚本(如
query_demo.py, holiday.py)。
- 判断是否衔接:根据初步分析结果,判断是否需要自动触发下一个技能(如下钻分析)进行深入探查。
核心结果展示:
第一阶段分析(核心指标与关联指标分析),分析结束后可自动衔接至下钻技能。

第二阶段分析(OLAP多维度下钻分析),数据视角更加深入。

注意:文章内容均为测试环境数据
关键洞察:
- 业务经验抽象的质量,决定了Agent能力的上限。技能封装的是知识和方法论。
- Agent Skills方案,显著降低了将业务经验注入到大模型应用的技术复杂度。
- Scripts是双刃剑,在为Agent扩展强大能力边界的同时,也带来了执行外部代码的安全隐患,务必谨慎使用来自外部的Skills。
“核心业务指标分析逻辑”技能原文件示例
---
name: 核心业务指标分析逻辑
description: 分析指标1指标及其关联指标的周环比变化,识别影响因子和异常原因。使用场景:当用户需要分析业务指标变化、查找指标下降原因、进行指标根因分析时。
---
# 核心业务指标分析逻辑
分析指标1指标及其关联指标的周环比变化,识别影响因子和可能原因。
## 分析流程
### 1. 获取指标1周环比数据
调用 `scripts/query_demo.py` 获取指标1指标的周环比数据:
python scripts/query_demo.py 指标1 --json
返回数据包含:
- 今日日期、上周同期日期
- 今日指标值、上周同期指标值
- 变化率(周环比)
### 2. 判断是否需要深入分析
**如果指标1环比下降**,继续执行以下步骤:
#### 2.1 获取关联指标数据
调用 `scripts/query_demo.py` 获取以下指标的周环比数据:
- 指标1
- 指标2
- 指标3
- 指标4
- 指标5
python scripts/query_demo.py <指标名称> --json
#### 2.2 分析影响因子
对比各指标的变化率,识别:
- 哪个指标对指标1影响较大(变化率最显著)
- 指标间的关联关系
- 可能的原因分析
### 3. 获取节假日信息(可选)
如需考虑节假日因素,调用 `scripts/holiday.py`:
python scripts/holiday.py
返回指定日期范围内的工作日和节假日信息,用于判断指标变化是否受节假日影响。
### 4. 进行OLAP下钻分析(可选)
对于影响较大的指标,可进行OLAP下钻分析以识别细分维度的贡献度:
参考 `OLAP下钻分析` 技能,使用该技能进行多维度下钻分析。
## 支持的指标
- 指标1(核心指标)
- 指标2
- 指标3
- 指标4
- 指标5
## 分析输出建议
分析结果应包含:
1. **核心指标状态**
- 指标1周环比变化
- 变化趋势(上升/下降/持平)
2. **关联指标分析**(如指标1下降)
- 各关联指标的周环比数据
- 影响因子排序
- 指标关联性分析
3. **可能原因**
- 基于数据变化的可能原因推断
- 节假日因素(如适用)
- 其他外部因素考虑
4. **下钻分析结果**(如适用)
- 细分维度的贡献度分析
- 关键维度识别
## 使用示例
**示例:分析指标1下降原因**
# 1. 获取指标1数据
python scripts/query_demo.py 指标1 --json
# 2. 如果下降,获取关联指标
python scripts/query_demo.py 指标2 --json
python scripts/query_demo.py 指标3 --json
python scripts/query_demo.py 指标4 --json
python scripts/query_demo.py 指标5 --json
# 3. 检查节假日因素
python scripts/holiday.py
# 4. 对影响最大的指标进行下钻分析(如指标2)
展望:Skill生态与AI工程化
Agent Skills 并非一个简单的“新功能”,它标志着AI应用开发从“单体智能”向“组件化智能”的范式转变。它的核心价值,在于为“模型智能”的工程化落地,定义了一种可组合、可复用的 “能力单元”设计范式。
未来的竞争维度可能将发生根本变化:焦点将从 “你的单体模型(巨石应用) 性能多强?”,逐渐转向 “你的‘技能包管理器’(Skill 生态)有多丰富、可靠和高效?”。拥有强大模型但缺乏易用、标准化能力接口的厂商,可能会像拥有最强单核CPU却缺乏操作系统和软件生态一样,在真正的应用战场中失势。
Skill 规范,正是在尝试为AI智能体的世界定义那个至关重要的 “操作系统层” 和 “包管理协议”。