当前,AI智能体已经能够灵活调用工具、执行复杂任务,但一个核心痛点始终未解:它们缺乏系统化的技能积累与迁移机制。简单来说,每次任务都像是“从零开始”,无法复用过往的成功经验。
针对这一挑战,浙江大学联合阿里巴巴、蚂蚁集团、腾讯等机构的研究团队提出了 SkillNet。这项研究将 20万+ Skills 组织成结构化的网络 Graph,旨在为AI Agent构建可积累、可复用的技能基础设施,让AI告别“重复造轮子”。

相关资源链接:
https://export.arxiv.org/pdf/2603.04448
SkillNet: Create, Evaluate, and Connect AI Skills
http://skillnet.openkg.cn
https://github.com/zjunlp/SkillNet
想象一下,人类程序员学会一个算法后,会将这种能力内化并在未来复用;而今天的AI智能体却在每个任务中“重复造轮子”——同样的解决方案在不同场景中被反复发现,却无法沉淀为可复用的能力。这种“瞬时经验”与“持久掌握”之间的鸿沟,严重制约了智能体的长期进化。
正如论文所指出的,AI发展经历了三个时代:
- 符号时代:规则僵化、难以扩展
- 深度学习时代:知识隐于参数,难以解释和复用
- 智能体时代(当下):亟需将经验转化为模块化、可解释、可复用的技能单元

图1:SkillNet概览——将20万+技能组织成结构化网络,支持多维度评估
方案:SkillNet的三层技能基础设施
SkillNet提出了一个完整的技能生命周期框架,包含 创建、评估、连接 三大核心能力。
1. 技能创建:从碎片化经验中提取能力
SkillNet支持从多种异构来源自动创建技能:
- 执行轨迹:智能体的操作日志
- GitHub项目:开源代码仓库
- 办公文档:PDF、PPT、Word等
- 自然语言提示:用户的直接描述
通过LLM驱动的流水线,这些原始素材被结构化为标准化的技能包(Skill Package),包含元数据、执行指令和可选的代码资源。这就像为杂乱无章的开源实战经验建立了一个系统化的知识库。

图2:SkillNet端到端流程——从多源输入到高质量技能网络的完整链路
2. 技能评估:五维质量保障体系
不同于现有平台仅依赖社区点赞或下载量,SkillNet建立了 自动化、多维度的评估框架,确保入库技能的质量与可靠性:
| 评估维度 |
说明 |
| 安全性 |
防范危险操作和提示注入攻击 |
| 完整性 |
步骤是否齐全、依赖是否明确 |
| 可执行性 |
能否在沙箱环境中成功运行 |
| 可维护性 |
模块化程度与向后兼容性 |
| 成本意识 |
时间、计算资源和API开销 |

图4:技能评估质量分布与可靠性验证——自动化评估器与人类标注高度一致(QWK≈1.0)
3. 技能连接:构建可推理的技能图谱
SkillNet通过三层本体(Ontology) 组织技能,形成可查询、可推理的知识网络:
- 分类层:Development、AIGC、Science等10大领域
- 关系层:定义
similar_to(相似)、compose_with(组合)、depend_on(依赖)、belong_to(归属)等语义关系
- 包层:将相关技能打包为任务导向的集合,方便一键调用

图3:SkillNet技能本体——三层架构实现从抽象分类到具体部署的完整映射
结论:显著提效与广泛适用
实验在 ALFWorld(家庭环境)、WebShop(在线购物)、ScienceWorld(科学实验)三个基准上进行,结果令人瞩目:

表1:SkillNet在三个环境中的性能提升(R↑=奖励越高越好,S↓=步骤越少越好)
核心结论:
- 平均奖励提升40%,执行步骤减少30%
- 效果跨模型稳健:从轻量级o4 Mini到强大的Gemini 2.5 Pro均显著受益
- 泛化能力强:在“未见过”的任务上同样表现优异

图6:多模型多环境性能对比——SkillNet consistently优于ReAct和Few-Shot基线
最后
SkillNet的本质是 将智能体的经验转化为资产。通过标准化创建、多维度评估和结构化连接,它让技能从孤立的代码片段进化为可发现、可组合、可演化的网络。这为解决AI Agent的“记忆”与“经验复用”难题提供了一条切实可行的工程化路径。
论文最后展望,这一基础设施将支撑“一人公司”或“一人实验室”的愿景——人类专家指挥智能体社会,而技能成为知识交换与能力积累的核心媒介。对于希望深入理解其架构细节与实现方式的开发者,建议查阅项目 官方文档 与代码库。

图7:SkillNet应用场景示例——分解用户任务并匹配评估后的技能
这项由顶尖学术机构与科技公司联合推进的工作,展示了如何将前沿的人工智能研究与大规模工程实践相结合。对于关注Agent技术发展的开发者而言,SkillNet的设计理念与实现方案具有很高的参考价值。更多关于AI、云计算与数据科学的前沿讨论,欢迎访问云栈社区进行交流。