Anthropic近期分享了一个极具启发性的观点:与其执着于构建通用的智能体,不如专注于构建具体的技能。
这个观点直指当前大型语言模型应用开发的核心,理解它,或许能帮助你更高效地利用AI能力。
1. 当前Agent的局限性
我们可以用一个比喻来理解:今天的Agent就像一个智商300的天才,但完全没有工作经验。你让它处理报税?复杂的计算它或许会,但它不了解现实世界中的具体流程、行业规则以及那些“只可意会”的潜规则。
因此,当下的Agent虽然足够“聪明”,但普遍缺乏执行专业任务所需的“经验”。
2. 什么是Skills?
可以将其理解为承载“专业经验”的工具包或流程手册。
Skills的核心不在于封装“智能”,而在于封装“如何一步步完成某件专业工作”的经验与流程。例如,如果你是财务专家,你可以创建一个“报税Skill”:
- 第一步:需要收集哪些类型的单据和文件?
- 第二步:核对的关键数据点和合规项是什么?
- 第三步:常见的错误排查与复核流程是怎样的?
- ……
你将这个专业过程结构化、清晰地描述出来,AI就能学习并复用这套方法。这就是Skill。
它的强大之处并非源于技术复杂度,而在于其“可构建性”——每个领域的专家都可以为自己的工作创建Skills。
3. MCP 与 Skills 的关系
在Anthropic的框架中,这两者分工明确,相辅相成:
- MCP (Model Context Protocol):负责将AI“连接”到各种外部工具、数据库和系统(如API)。它解决了AI的“手”和“眼”的问题。
- Skills:负责告诉AI如何具体完成一项专业任务(流程、步骤、技巧)。它解决了AI的“专业知识”和“工作经验”问题。
一个形象的比喻是:你想让AI胜任“财务专员”的工作。
- MCP相当于为AI接入了Excel、财务软件和数据库。
- Skills则是你作为资深财务,手把手教给AI的整套工作方法论。
两者结合,AI才能真正上岗实操。
4. 类比计算机系统
我们可以用更熟悉的计算机架构来理解这一思想:
- 大语言模型 (LLM) = CPU:提供基础的通用计算(推理)能力。
- Agent = 操作系统:负责资源调度与任务管理。
- Skills = 软件/应用程序:真正解决用户具体问题的功能实体。
关键在于:CPU和操作系统主要由少数顶尖公司研发,但海量的、满足各种需求的软件,是由全球数百万开发者共同构建的。Anthropic正希望将这种模式引入AI领域,让“AI技能”的生态也走向开放与繁荣。
5. 为什么这一转向至关重要?
这标志着几个根本性的变化:
- 民主化创造:任何领域的专家都可以将自己的经验沉淀为Skill,赋能AI。
- 经验赋能:AI将不再是空有高智商却无经验的“毕业生”,而是装备了成熟方法论的专业人士。
- 能力复用:一个优质的Skill可以被无数个不同的Agent调用,规模化地提升其专业能力。
- 价值转移:AI应用的核心价值将越来越多地来源于这些精心构建的Skills,而不仅仅是底层模型的性能。
这或许正预示着 “AI的App Store时刻” 的到来。
总结
停止打造那些看似聪明却难以交付实际价值的通用Agent。未来的方向是让AI装备上一个个具体的Skills(专业技能包)。只有这样,它才能从一个聪明的对话者,转变为你团队中能立刻上手干活、创造价值的专业成员。
|