云栈社区»论坛 › 回收站「 Recycle Bin 」 › Agent Skills如何赋能货拉拉大数据应用：SQL生成与指标归因实战 ...

发回帖发新帖

1973 积分	0 好友	257 主题

发消息

Agent Skills如何赋能货拉拉大数据应用：SQL生成与指标归因实战

发表于 2026-1-24 20:25:25 | 查看: 86| 回复: 0

北京时间2025年12月，Anthropic正式将Agent Skills发布为开放标准。在上次分享了MCP的探索后，这次我们迫不及待地体验了Agent Skills，看看它是否如宣传般强大。

Agent Skills是什么？

根据Anthropic官网的定义：

This led us to create Agent Skills: organized folders of instructions, scripts, and resources that agents can discover and load dynamically to perform better at specific tasks.

简单来说，Agent Skills是可被智能体动态发现和加载的、包含指令、脚本和资源的结构化文件夹。要理解Agent Skills，最好与MCP（模型上下文协议）和A2A（智能体间协作）进行对比。

Agent + Skills + Virtual Machine 架构示意图

引用：Anthropic 工程团队博客

一个核心结论是：Agent Skills定义“能力”，MCP提供“工具”，A2A实现“协作”。

三者对比

Agent Skills、MCP、A2A对比表格

MCP急加载与Skills懒加载流程对比图

核心关系

你可以将这三者理解为构建一个“智能体公司”的不同部门：

Agent Skills 像是公司的各个专业员工，他们各自掌握了完成特定任务（如写代码、做设计、分析数据）的完整方法和流程。
MCP 像是公司的统一后勤与工具库。无论哪个员工需要工具（如使用数据库、调用API），都通过标准流程从这个库中领取。
A2A 像是公司内部的协作通讯协议和会议制度。当复杂任务需要多个部门员工（即多个智能体）合作时，他们依据这套规则进行沟通与交付。

Agent Skills的核心优势

Agent Skills的设计思路有别于传统的MCP开发模式，其官网揭示了几个值得关注的突出特点。

特点一：渐进式披露 (Progressive Disclosure)

渐进式披露 是Agent Skills设计中的核心原则，它让智能体的技能体系既灵活又可扩展。就像一本结构清晰的说明书，先给目录，再分章节，最后附上详细附录。技能的设计也是如此，让Claude只在需要时才加载对应的信息。

当智能体具备文件系统和代码执行工具时，它无需在处理任务时一次性将所有技能内容读入上下文窗口。这意味着，一个技能所能涵盖的信息量实际上没有上限。理论上，你可以为一个Agent装备数百甚至无限个技能（从写SQL到分析数据），而它们仅占用极少的上下文（Context）空间，只在执行相关任务时才被调用。这完美解决了长期困扰开发者的Token浪费和上下文干扰问题。

特点二：LLM不是万能的，让代码做它擅长的事

大语言模型虽然强大，但有些确定性操作交给传统代码来执行显然更高效、更可靠。例如，让模型通过逐词生成来排序列表，远比直接运行排序算法的消耗大得多。除了效率，许多实际应用场景需要确定性的、可靠的结果——而这恰恰是代码的强项。

Agent Skills提出，许多具有清晰输入输出逻辑的确定性任务，可以拆解为由传统代码执行，效果甚至更好。它的优势在于，代码脚本只会在具体执行时被触发（Claude can run this script without loading either the script or the PDF into context.），而无需像传统Agent方式那样，将所有可能用到的工具描述和文档都预先塞进Prompt上下文。

Skills与上下文窗口交互流程图

引用：Anthropic 工程团队博客 - 技能在上下文窗口中被触发

实战落地：货拉拉的应用尝试

了解了理论，我们来看看如何在实战中应用。一个标准的Skill结构大致如下：

标准Skill目录结构示意图

其核心是编写 SKILL.md 文件。

SKILL.md 配置文件模板示例

必需字段：

name - 技能的名字（小写字母、数字、下划线）
description - 技能功能和使用场景描述，帮助AI判断何时使用

在云栈社区的人工智能板块，我们经常探讨如何将前沿的AI能力与具体业务结合。接下来，我们将分享在货拉拉大数据场景下的两个实战案例。

实战一：自然语言查询数据

背景

在大数据分析中，存在大量如财务对账、A/B实验报告等固定场景的数据查询需求。Agent Skills 可将这些流程性的知识打包成可组合、可复用的技能。我们无需为每个业务场景单独定制一个复杂的Agent，只需让通用Agent动态加载对应的技能，就能快速解决特定领域的问题。

案例设计

我们将财务分析和A/B实验报告中的自然语言查数需求，抽象为以下通用步骤：

理解用户意图：识别查询目标（财务数据、实验订单数据、用户行为数据等）。
加载领域知识：读取对应场景的元数据表、业务术语定义等信息。
生成SQL逻辑：基于知识，识别应使用的数据库（如Hive、Doris）及相关SQL编写规范。
执行并返回结果：调用对应的脚本工具（如hive.py & doris.py）执行查询，并格式化结果。

现在，我们将这一整套流程打包成一个 “SQL生成”技能，其目录结构设计如下：

SQL生成技能目录结构示例

当我们在Agent中注册这个技能后，它便具备了快速响应自然语言查数需求的能力。

财务数据查询对话与结果界面
财务数据查询场景

A/B实验报告查询对话与结果界面
A/B实验报告查询场景

通过将自然语言查数能力技能化，各业务线的Agent不再需要重复定制查数逻辑，只需维护好自己领域的知识文档，就能快速解决查询问题。整个流程变得更加标准化，易于治理和迭代。

实战二：业务指标归因分析

背景

面对海量数据，如何快速定位核心指标波动的原因，是发挥数据价值的关键。我们利用Agent Skills封装了指标归因分析的能力。

指标归因分析技能能力说明

技能思维导图结构

核心流程：

理解用户意图：根据问题选择“核心业务指标分析”或“OLAP下钻分析”技能。
加载领域知识：读取技能文档（SKILL.md），理解分析框架和可用工具。
解析并执行脚本：识别并调用技能包中提供的Python分析脚本（如query_demo.py, holiday.py）。
判断是否衔接：根据初步分析结果，判断是否需要自动触发下一个技能（如下钻分析）进行深入探查。

核心结果展示：

第一阶段分析（核心指标与关联指标分析），分析结束后可自动衔接至下钻技能。
核心业务指标分析结果报告

第二阶段分析（OLAP多维度下钻分析），数据视角更加深入。
OLAP下钻分析结果报告

注意：文章内容均为测试环境数据

关键洞察：

业务经验抽象的质量，决定了Agent能力的上限。技能封装的是知识和方法论。
Agent Skills方案，显著降低了将业务经验注入到大模型应用的技术复杂度。
Scripts是双刃剑，在为Agent扩展强大能力边界的同时，也带来了执行外部代码的安全隐患，务必谨慎使用来自外部的Skills。

“核心业务指标分析逻辑”技能原文件示例

---
name: 核心业务指标分析逻辑
description: 分析指标1指标及其关联指标的周环比变化，识别影响因子和异常原因。使用场景：当用户需要分析业务指标变化、查找指标下降原因、进行指标根因分析时。
---

# 核心业务指标分析逻辑

分析指标1指标及其关联指标的周环比变化，识别影响因子和可能原因。

## 分析流程

### 1. 获取指标1周环比数据

调用 `scripts/query_demo.py` 获取指标1指标的周环比数据：

python scripts/query_demo.py 指标1 --json

返回数据包含：
- 今日日期、上周同期日期
- 今日指标值、上周同期指标值
- 变化率（周环比）

### 2. 判断是否需要深入分析

**如果指标1环比下降**，继续执行以下步骤：

#### 2.1 获取关联指标数据

调用 `scripts/query_demo.py` 获取以下指标的周环比数据：
- 指标1
- 指标2
- 指标3
- 指标4
- 指标5

python scripts/query_demo.py <指标名称> --json

#### 2.2 分析影响因子

对比各指标的变化率，识别：
- 哪个指标对指标1影响较大（变化率最显著）
- 指标间的关联关系
- 可能的原因分析

### 3. 获取节假日信息（可选）

如需考虑节假日因素，调用 `scripts/holiday.py`：

python scripts/holiday.py

返回指定日期范围内的工作日和节假日信息，用于判断指标变化是否受节假日影响。

### 4. 进行OLAP下钻分析（可选）

对于影响较大的指标，可进行OLAP下钻分析以识别细分维度的贡献度：

参考 `OLAP下钻分析` 技能，使用该技能进行多维度下钻分析。

## 支持的指标

- 指标1（核心指标）
- 指标2
- 指标3
- 指标4
- 指标5

## 分析输出建议

分析结果应包含：

1. **核心指标状态**
   - 指标1周环比变化
   - 变化趋势（上升/下降/持平）

2. **关联指标分析**（如指标1下降）
   - 各关联指标的周环比数据
   - 影响因子排序
   - 指标关联性分析

3. **可能原因**
   - 基于数据变化的可能原因推断
   - 节假日因素（如适用）
   - 其他外部因素考虑

4. **下钻分析结果**（如适用）
   - 细分维度的贡献度分析
   - 关键维度识别

## 使用示例

**示例：分析指标1下降原因**

# 1. 获取指标1数据
python scripts/query_demo.py 指标1 --json

# 2. 如果下降，获取关联指标
python scripts/query_demo.py 指标2 --json
python scripts/query_demo.py 指标3 --json
python scripts/query_demo.py 指标4 --json
python scripts/query_demo.py 指标5 --json

# 3. 检查节假日因素
python scripts/holiday.py

# 4. 对影响最大的指标进行下钻分析（如指标2）

展望：Skill生态与AI工程化

Agent Skills 并非一个简单的“新功能”，它标志着AI应用开发从“单体智能”向“组件化智能”的范式转变。它的核心价值，在于为“模型智能”的工程化落地，定义了一种可组合、可复用的 “能力单元”设计范式。

未来的竞争维度可能将发生根本变化：焦点将从 “你的单体模型（巨石应用） 性能多强？”，逐渐转向 “你的‘技能包管理器’（Skill 生态）有多丰富、可靠和高效？”。拥有强大模型但缺乏易用、标准化能力接口的厂商，可能会像拥有最强单核CPU却缺乏操作系统和软件生态一样，在真正的应用战场中失势。

Skill 规范，正是在尝试为AI智能体的世界定义那个至关重要的 “操作系统层” 和 “包管理协议”。

上一篇：Mac mini A1347拆解记录：闲鱼150元购机，内部构造与电源分析
下一篇：LummaC2信息窃取木马后续感染模式：Pastebin分发与持久化C2通信分析

智能体技能, 大数据, SQL, 数据分析, 货拉拉