找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1009

积分

0

好友

131

主题
发表于 3 天前 | 查看: 9| 回复: 0

自 Claude Skills 功能上线以来,开发者社区涌现了大量实践案例,例如文生图 Skill 或编码浏览器 Skill,展现了其多样化的应用潜力。

图片

图片

那么,Skills 究竟是什么?根据官方定义,一个 Skill 就是一个包含指令、脚本与资源的文件夹,Claude 能在需要时自动加载它,从而调用特定“技能”来完成专业任务。

近期,Anthropic 的工程师、Skills 功能的创造者 Barry Zhang 和 Mahesh Murag 分享了一个核心观点:开发者应当停止重复构建孤立的 Agent,转而开始为通用 Agent 构建和分享 Skills。

图片

他们指出,当前许多 Agent 虽然足够智能,但缺乏在实际工作中所需的深度领域专长,难以像人类专家一样提供稳定、可靠的执行力。为此,他们提出了 Agent Skills 这一新范式。技能本质上是打包可组合程序性知识的文件集合,旨在让 Agent 从一个聪明的“通才”转变为一个专业的“专家”。

Agent 的现状:智能有余,专业不足

随着 Agent 技术的发展,其核心脚手架已趋于通用化。Anthropic 的 Claude Code Agent 印证了 代码 是通向数字世界的通用接口,即“代码就是你所需要的(Code is all you need)”。

图片

一个 Agent 可以调用 API、组织数据、使用 Python 进行分析并输出结果,其底层能力甚至可以精简到只需要 Bash 和文件系统。Claude 团队发现,不同垂直领域(如财务、数据分析)的 Agent 底层逻辑高度相似,完全可以用通用的代码能力解决。

图片

但这带来了一个新问题:Agent 虽然聪明,但并不专业

Barry 做了一个生动的比喻:你更愿意让谁帮你处理税务?是一个智商 300 的数学天才,还是一个经验丰富的税务专家?现有的通用 Agent 就像那位天才,它们足够聪明,但在缺乏特定领域知识和上下文时,无法持续、一致地执行专业任务。我们需要的恰恰是后者——能够基于深厚知识库提供稳定输出的领域专家。

为解决这一问题,Claude 团队推出了 Agent Skills

图片

Skills:为 Agent 注入可组合的专业能力

Skills 实质上是一种有组织的文件夹结构,用于打包程序化知识。其内容可以是脚本、代码、配置文件,也可以是工具或资源。它支持版本管理,便于团队共享和迭代。

图片

例如,Claude 可以编写一个 Python 脚本为幻灯片添加特定样式。如果将该脚本保存为一个 Skill,未来遇到类似任务时便可直接调用,不仅效率更高,而且输出结果更加一致。

Skills 让 Agent 的“记忆”变得具体化:它记录了在特定任务上有效的程序性知识,并能在未来被复用。

Skills 的核心优势
  1. 兼容性与版本控制:技能以文件夹形式存在,可直接利用现有的基础设施进行管理,如使用 Git 进行版本控制、存入云盘或打包分享。
  2. 代码即工具:技能文件夹内可包含脚本作为工具。这解决了传统“工具”的几个痛点:描述模糊、不可修改、始终占用宝贵的上下文窗口。而脚本本身是自我文档化的,可被 Agent 按需修改,并且平时只存放在文件系统中,仅在需要时才被加载。
  3. 渐进式披露:为保护有限的上下文窗口,Agent 初始仅能看到技能的元数据。只有当它决定使用某项技能时,才会读取文件夹内的 skill.md(包含核心指令)及其他具体内容。

图片

图片

Skills 的三大类型

在 Skills 发布后的短时间内,其生态迅速演化出三类主要形态:

1. 基础技能
为 Agent 提供通用或新领域的基础能力。例如,Claude 团队开发的文档技能,使其能够创建和编辑专业级的办公文档。

图片

2. 第三方技能
由生态合作伙伴为其产品或工具构建。例如,Browserbase 的 Stagehand 技能增强了 Claude 的浏览器自动化能力;Notion 推出的一系列技能帮助 Claude 深度理解并操作用户的 Notion 工作区。

图片

3. 企业定制技能
企业内部针对特有业务流程和软件定制的技能。目前,已有《财富》100 强企业和大型开发团队使用 Skills 来教导 Agent 公司内部的最佳实践、代码规范等。

图片

这三类 Skills 的共同原则是:任何人都可以创建,任何 Agent 都能因此获得新能力。生态发展还呈现出几个趋势:技能复杂度增加(包含软件、可执行文件等);与 MCP 服务器协同工作(MCP 负责外部连接,Skills 提供专业知识);甚至非技术岗位(如财务、法律人员)也能成功构建技能。

图片

通用 Agent 的新兴架构

Mahesh 指出,Skills 的兴起正在推动通用 Agent 架构的融合,形成以下核心组件:Agent Loop (循环) + Runtime (运行时环境) + MCP Servers (外部工具/数据) + Skills Library (技能库)

图片

  • Agent Loop 管理模型内部上下文及输入输出的 Token 流。
  • Agent Runtime 提供文件系统和代码读写等基础执行环境。
  • MCP 服务器 提供与外部世界(如搜索引擎、数据库)的连接。
  • 技能库 则提供了垂直领域的专业知识。

通过为 Agent 配备正确的 MCP 服务器和相应的技能库,可以快速将其部署到新的垂直领域。这也正是 Anthropic 在 Skills 发布后,得以迅速在金融服务和生命科学领域推出新产品的原因。

Skills 的未来:持续学习与知识共享

Mahesh 强调,Skills 的长期价值在于其共享和分发能力,能够为组织乃至更广阔的社区构建一个持续演进、集体共有的知识库

  1. 实现持续学习:Skills 是 Agent 实现持续学习的具体载体。它将抽象的“记忆”概念具象化,并非捕捉所有信息,而是精准捕获可在特定任务中复用的程序性知识。
  2. 知识可转移:Agent 写下的任何程序性知识,都可以被未来的自己或其他 Agent 高效使用,使得学习成果具有真正的可转移性。
  3. Agent 创建技能:Claude 目前已经可以利用“技能创建者”技能(Skill Creator Skill)来为用户自动创建技能。

Barry 提出了一个明确的目标:Claude 在与用户合作的第 30 天,要比第 1 天更聪明。
未来,团队计划像管理软件一样管理技能:引入测试、评估、版本控制和依赖管理,使 Agent 在不同环境下的行为更可预测、更可靠。

终极比喻:模型如处理器,Skills 如应用软件

Claude 团队将整个 Agent 架构类比为一台计算机:

  • 模型 如同处理器,潜力巨大但单独使用价值有限。
  • Agent 运行时 如同操作系统,管理输入输出、协调资源,释放模型潜力。
  • Skills 则如同应用软件,编码了专业知识和独特的工作流,让 Agent 真正变得“有用”。

这意味着,真正的价值往往不在基础模型本身,而在其之上构建的应用层。Skills 正是打开这层价值的钥匙,它允许任何人通过简单地组织文件和文件夹,来解决具体而复杂的问题。

因此,停止重复“造轮子”般地构建功能雷同的 Agent,将精力投入到构建和分享 Skills 上,才能让 Agent 变得更专业、更高效,并且更易于扩展和复用。




上一篇:灵光APP实战:AI编程生成科普动画与30秒快速开发学习应用
下一篇:嵌入式软件崩溃调试全指南:Linux系统12类典型场景与应对策略
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2025-12-17 17:36 , Processed in 0.109515 second(s), 40 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2025 云栈社区.

快速回复 返回顶部 返回列表