找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

703

积分

0

好友

91

主题
发表于 昨天 20:25 | 查看: 1| 回复: 0

北京时间2025年12月,Anthropic正式将Agent Skills发布为开放标准。在上次分享了MCP的探索后,这次我们迫不及待地体验了Agent Skills,看看它是否如宣传般强大。

Agent Skills是什么?

根据Anthropic官网的定义:

This led us to create Agent Skills: organized folders of instructions, scripts, and resources that agents can discover and load dynamically to perform better at specific tasks.

简单来说,Agent Skills是可被智能体动态发现和加载的、包含指令、脚本和资源的结构化文件夹。要理解Agent Skills,最好与MCP(模型上下文协议)和A2A(智能体间协作)进行对比。

Agent + Skills + Virtual Machine 架构示意图

引用:Anthropic 工程团队博客

一个核心结论是:Agent Skills定义“能力”,MCP提供“工具”,A2A实现“协作”。

三者对比

Agent Skills、MCP、A2A对比表格

MCP急加载与Skills懒加载流程对比图

核心关系

你可以将这三者理解为构建一个“智能体公司”的不同部门:

  • Agent Skills 像是公司的各个专业员工,他们各自掌握了完成特定任务(如写代码、做设计、分析数据)的完整方法和流程。
  • MCP 像是公司的统一后勤与工具库。无论哪个员工需要工具(如使用数据库、调用API),都通过标准流程从这个库中领取。
  • A2A 像是公司内部的协作通讯协议和会议制度。当复杂任务需要多个部门员工(即多个智能体)合作时,他们依据这套规则进行沟通与交付。

Agent Skills的核心优势

Agent Skills的设计思路有别于传统的MCP开发模式,其官网揭示了几个值得关注的突出特点。

特点一:渐进式披露 (Progressive Disclosure)

渐进式披露 是Agent Skills设计中的核心原则,它让智能体的技能体系既灵活又可扩展。就像一本结构清晰的说明书,先给目录,再分章节,最后附上详细附录。技能的设计也是如此,让Claude只在需要时才加载对应的信息。

当智能体具备文件系统和代码执行工具时,它无需在处理任务时一次性将所有技能内容读入上下文窗口。这意味着,一个技能所能涵盖的信息量实际上没有上限。理论上,你可以为一个Agent装备数百甚至无限个技能(从写SQL到分析数据),而它们仅占用极少的上下文(Context)空间,只在执行相关任务时才被调用。这完美解决了长期困扰开发者的Token浪费上下文干扰问题。

特点二:LLM不是万能的,让代码做它擅长的事

大语言模型虽然强大,但有些确定性操作交给传统代码来执行显然更高效、更可靠。例如,让模型通过逐词生成来排序列表,远比直接运行排序算法的消耗大得多。除了效率,许多实际应用场景需要确定性的、可靠的结果——而这恰恰是代码的强项。

Agent Skills提出,许多具有清晰输入输出逻辑的确定性任务,可以拆解为由传统代码执行,效果甚至更好。它的优势在于,代码脚本只会在具体执行时被触发(Claude can run this script without loading either the script or the PDF into context.),而无需像传统Agent方式那样,将所有可能用到的工具描述和文档都预先塞进Prompt上下文。

Skills与上下文窗口交互流程图

引用:Anthropic 工程团队博客 - 技能在上下文窗口中被触发

实战落地:货拉拉的应用尝试

了解了理论,我们来看看如何在实战中应用。一个标准的Skill结构大致如下:

标准Skill目录结构示意图

其核心是编写 SKILL.md 文件。

SKILL.md 配置文件模板示例

必需字段:

  • name - 技能的名字(小写字母、数字、下划线)
  • description - 技能功能和使用场景描述,帮助AI判断何时使用

云栈社区的人工智能板块,我们经常探讨如何将前沿的AI能力与具体业务结合。接下来,我们将分享在货拉拉大数据场景下的两个实战案例。

实战一:自然语言查询数据

背景

大数据分析中,存在大量如财务对账、A/B实验报告等固定场景的数据查询需求。Agent Skills 可将这些流程性的知识打包成可组合、可复用的技能。我们无需为每个业务场景单独定制一个复杂的Agent,只需让通用Agent动态加载对应的技能,就能快速解决特定领域的问题。

案例设计

我们将财务分析和A/B实验报告中的自然语言查数需求,抽象为以下通用步骤:

  1. 理解用户意图:识别查询目标(财务数据、实验订单数据、用户行为数据等)。
  2. 加载领域知识:读取对应场景的元数据表、业务术语定义等信息。
  3. 生成SQL逻辑:基于知识,识别应使用的数据库(如Hive、Doris)及相关SQL编写规范。
  4. 执行并返回结果:调用对应的脚本工具(如hive.py & doris.py)执行查询,并格式化结果。

现在,我们将这一整套流程打包成一个 “SQL生成”技能,其目录结构设计如下:

SQL生成技能目录结构示例

当我们在Agent中注册这个技能后,它便具备了快速响应自然语言查数需求的能力。

财务数据查询对话与结果界面
财务数据查询场景

A/B实验报告查询对话与结果界面
A/B实验报告查询场景

通过将自然语言查数能力技能化,各业务线的Agent不再需要重复定制查数逻辑,只需维护好自己领域的知识文档,就能快速解决查询问题。整个流程变得更加标准化,易于治理和迭代。

实战二:业务指标归因分析

背景

面对海量数据,如何快速定位核心指标波动的原因,是发挥数据价值的关键。我们利用Agent Skills封装了指标归因分析的能力。

指标归因分析技能能力说明

技能思维导图结构

核心流程:

  1. 理解用户意图:根据问题选择“核心业务指标分析”或“OLAP下钻分析”技能。
  2. 加载领域知识:读取技能文档(SKILL.md),理解分析框架和可用工具。
  3. 解析并执行脚本:识别并调用技能包中提供的Python分析脚本(如query_demo.py, holiday.py)。
  4. 判断是否衔接:根据初步分析结果,判断是否需要自动触发下一个技能(如下钻分析)进行深入探查。

核心结果展示:

第一阶段分析(核心指标与关联指标分析),分析结束后可自动衔接至下钻技能。
核心业务指标分析结果报告

第二阶段分析(OLAP多维度下钻分析),数据视角更加深入。
OLAP下钻分析结果报告

注意:文章内容均为测试环境数据

关键洞察:

  1. 业务经验抽象的质量,决定了Agent能力的上限。技能封装的是知识和方法论。
  2. Agent Skills方案,显著降低了将业务经验注入到大模型应用的技术复杂度
  3. Scripts是双刃剑,在为Agent扩展强大能力边界的同时,也带来了执行外部代码的安全隐患,务必谨慎使用来自外部的Skills。

“核心业务指标分析逻辑”技能原文件示例

---
name: 核心业务指标分析逻辑
description: 分析指标1指标及其关联指标的周环比变化,识别影响因子和异常原因。使用场景:当用户需要分析业务指标变化、查找指标下降原因、进行指标根因分析时。
---

# 核心业务指标分析逻辑

分析指标1指标及其关联指标的周环比变化,识别影响因子和可能原因。

## 分析流程

### 1. 获取指标1周环比数据

调用 `scripts/query_demo.py` 获取指标1指标的周环比数据:

python scripts/query_demo.py 指标1 --json

返回数据包含:
- 今日日期、上周同期日期
- 今日指标值、上周同期指标值
- 变化率(周环比)

### 2. 判断是否需要深入分析

**如果指标1环比下降**,继续执行以下步骤:

#### 2.1 获取关联指标数据

调用 `scripts/query_demo.py` 获取以下指标的周环比数据:
- 指标1
- 指标2
- 指标3
- 指标4
- 指标5

python scripts/query_demo.py <指标名称> --json

#### 2.2 分析影响因子

对比各指标的变化率,识别:
- 哪个指标对指标1影响较大(变化率最显著)
- 指标间的关联关系
- 可能的原因分析

### 3. 获取节假日信息(可选)

如需考虑节假日因素,调用 `scripts/holiday.py`:

python scripts/holiday.py

返回指定日期范围内的工作日和节假日信息,用于判断指标变化是否受节假日影响。

### 4. 进行OLAP下钻分析(可选)

对于影响较大的指标,可进行OLAP下钻分析以识别细分维度的贡献度:

参考 `OLAP下钻分析` 技能,使用该技能进行多维度下钻分析。

## 支持的指标

- 指标1(核心指标)
- 指标2
- 指标3
- 指标4
- 指标5

## 分析输出建议

分析结果应包含:

1. **核心指标状态**
   - 指标1周环比变化
   - 变化趋势(上升/下降/持平)

2. **关联指标分析**(如指标1下降)
   - 各关联指标的周环比数据
   - 影响因子排序
   - 指标关联性分析

3. **可能原因**
   - 基于数据变化的可能原因推断
   - 节假日因素(如适用)
   - 其他外部因素考虑

4. **下钻分析结果**(如适用)
   - 细分维度的贡献度分析
   - 关键维度识别

## 使用示例

**示例:分析指标1下降原因**

# 1. 获取指标1数据
python scripts/query_demo.py 指标1 --json

# 2. 如果下降,获取关联指标
python scripts/query_demo.py 指标2 --json
python scripts/query_demo.py 指标3 --json
python scripts/query_demo.py 指标4 --json
python scripts/query_demo.py 指标5 --json

# 3. 检查节假日因素
python scripts/holiday.py

# 4. 对影响最大的指标进行下钻分析(如指标2)

展望:Skill生态与AI工程化

Agent Skills 并非一个简单的“新功能”,它标志着AI应用开发从“单体智能”向“组件化智能”的范式转变。它的核心价值,在于为“模型智能”的工程化落地,定义了一种可组合、可复用的 “能力单元”设计范式

未来的竞争维度可能将发生根本变化:焦点将从 “你的单体模型(巨石应用) 性能多强?”,逐渐转向 “你的‘技能包管理器’(Skill 生态)有多丰富、可靠和高效?”。拥有强大模型但缺乏易用、标准化能力接口的厂商,可能会像拥有最强单核CPU却缺乏操作系统和软件生态一样,在真正的应用战场中失势。

Skill 规范,正是在尝试为AI智能体的世界定义那个至关重要的 “操作系统层”“包管理协议”




上一篇:Mac mini A1347拆解记录:闲鱼150元购机,内部构造与电源分析
下一篇:LummaC2信息窃取木马后续感染模式:Pastebin分发与持久化C2通信分析
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-1-25 20:36 , Processed in 0.307561 second(s), 39 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表