找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1523

积分

0

好友

223

主题
发表于 3 天前 | 查看: 7| 回复: 0

在深入探索AI Agent、AI组织与协作时,总会遇到三个容易混淆的概念:OpenSkills、AgentSkills和Anthropic Skills。你是否也困惑于它们究竟是不同的解决方案,还是同一事物的不同表述?厘清这三者的关系,是构建清晰、可扩展的人工智能能力体系的关键。本文将把它们置于一个三层的系统框架中,一次性讲透各自的定位与区别。

OpenSkills:技能描述与交换的“协议层”

首先从最易被误解的OpenSkills谈起。其核心要解决的问题是:现实世界中,人类对“技能”的描述(如“精通Python”)对计算机系统而言是模糊且不可计算的。

图片

OpenSkills的定位,是技能领域的“Schema”或“协议层”。它旨在将技能像数据一样进行结构化、标准化定义,从而实现跨系统的交换与验证。你可以将其类比为:

  • JSON Schema:之于数据
  • OpenAPI:之于Web服务

它主要关心的是:

  • 技能如何被标准化地描述?
  • 技能是否有清晰的输入、输出和边界定义?
  • 技能定义能否在不同平台和工具间流转?

而它刻意不关心

  • 技能由谁或什么来执行(是人、Agent还是API)。
  • 执行的成功率与效率。
  • 执行过程的安全与权限控制。

因此,OpenSkills的本质是定义“能力的语言”,而非“能力的执行”。

AgentSkills:面向AI Agent的“可执行能力接口”

如果说OpenSkills是“描述能力”,那么AgentSkills则进入了完全不同的维度——“执行能力”

图片

当我们构建实际的AI Agent系统时,会遇到一个核心工程问题:一个宣称拥有“数据分析”能力的Agent,系统如何知道它具体能做什么、需要什么工具、以及执行的成功率与成本如何?这正是AgentSkills要解决的。

AgentSkills的本质,是一个可执行、可评估、可调度的能力接口。它描述的不仅仅是“会不会”,更是一个包含以下要素的、可供系统调度的“任务单元”或“微服务”:

  • 输入(Input):明确的任务参数与格式。
  • 输出(Output):预期的结果类型与格式。
  • 依赖工具(Tools):完成任务需要调用的具体API、函数或资源。
  • 约束条件(Constraints):执行的超时、成本、权限等限制。
  • 评估指标(Metrics):如何量化本次执行的成功与否。

AgentSkills面向的是“系统决策与调度”,它让调度系统(或上级Agent)能够基于这些结构化信息,决定是否分配任务、如何分配资源,并预测执行结果。

Anthropic Skills:模型安全与治理的“能力边界”

第三个概念Anthropic Skills最容易引起混淆。看到Anthropic讨论Skills,很多人会误以为这是另一套工程化的Agent能力标准,实则不然。

图片

Anthropic Skills的关注点并非技能的工程化实现或交换,而是模型能力的安全、评估与治理。其核心目标在于:

  • 模型能力评估:系统性地评估大语言模型(LLM)是否具备某种抽象能力(如复杂推理、长期规划)。
  • 安全边界界定:识别某种能力(如说服、社会影响)可能被滥用的风险。
  • 风险控制与对齐:决定是否需要以及如何限制、削弱或延迟模型对某些高风险能力的获取与使用。

例如,Anthropic可能会研究模型的“说服能力”水平,并探讨是否需要在产品层面对其进行约束。这属于“模型能否被允许拥有或展现某种能力”的治理问题

因此,Anthropic Skills属于模型治理层(Model Governance Layer),与技能交换标准(OpenSkills)或执行接口(AgentSkills)不在同一范畴。

总结:三层能力体系框架

将三者置于同一张系统分层图中,关系便一目了然:

图片

这是一个自上而下、从抽象到具体、从治理到执行的清晰分层:

  1. Anthropic Skills(治理层):定义“能力的伦理与安全边界”。回答“模型是否应该/被允许拥有这种能力?”
  2. OpenSkills(协议层):定义“能力的通用描述语言”。回答“这种能力叫什么?它的标准化定义是什么?”
  3. AgentSkills(执行层):定义“能力的可执行实例”。回答“哪个Agent能用什么工具,以何种代价执行这个能力?”

举例说明:以「网页信息检索与总结」为例

同一个能力主题,在三层体系中有完全不同的处理方式:

  • Anthropic Skills层:关注这种检索与总结能力是否可能被用于制造虚假信息或侵犯隐私,从而考虑是否需要施加安全护栏。
  • OpenSkills层:关心如何标准化定义“网页信息检索与总结”这个技能类别,包括其输入(URL)、输出(摘要文本)、前提条件(网络访问)等通用元数据。
  • AgentSkills层:关心某个具体的“新闻摘要Agent”如何实现这个能力,它可能调用哪个爬虫工具、使用哪个LLM模型进行总结、预计耗时和Token成本是多少。

许多系统在设计初期陷入混乱,正是因为没有区分这三层,例如试图直接用Agent的工具定义(Tool/Prompt)来充当通用的技能描述(Skill Schema),导致技能不可复用、能力不可比较、系统行为难以解释。

理解并遵循这一三层结构,是构建未来模块化、可互操作、且安全可控的AI能力生态系统的基石。




上一篇:DroidMind MCP服务器:将Android真机调试接入Claude/Cursor AI工作流
下一篇:C语言指针与数组深度解析:内存地址操作与编程核心
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2025-12-24 12:44 , Processed in 0.253640 second(s), 40 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2025 云栈社区.

快速回复 返回顶部 返回列表