现在的AI面试题越来越“刁钻”,很多同学反馈,那些看起来相似的概念特别容易把人绕晕。比如,最近就有同学在面试中被问到:“skills 和 workflow 有什么区别?”
乍一听,你可能也会觉得:这俩不都是让AI按某种方式完成任务的东西吗?但面试官想要的,恰恰是你能分辨出它们本质上的不同。理解这组概念,是掌握现代AI应用系统设计的关键一步。
一图看懂:核心定位差异
先别急着下结论,我们来看一张结构图,它能帮你快速建立对相关概念的认知框架:

结合官方定义,我们可以更清晰地划清界限:
- Workflow(工作流): Anthropic将其定义为 “LLM和工具按照预定义代码路径被编排起来的系统”。它的核心是 “编排”。
- Skill(技能): 在Claude Code等文档的描述中,它更接近 “一类可复用的模块化能力” ,可以包含说明、约定、模板或具体的执行指引。它的核心是 “能力”。
用一句话概括:Workflow 是流程编排,Skill 是能力封装。

五大维度深入对比
理解了基本定位,我们再从系统设计的角度,拆解它们在五个关键维度的不同。
1. 关注点:任务推进 vs. 局部能力
Workflow 关注的是“任务推进”。
它像一个总指挥官,思考的是整个战役如何展开:用户请求进来后,先分类还是先抽取信息?某个步骤失败了要不要重试、重试几次?A条件满足时走小模型分支,B条件满足时走大模型分支?何时调用外部搜索工具,何时需要转入人工审核流程?
因此,Workflow本质上是一张 “执行蓝图” ,负责决定动作的顺序、分支、依赖、重试策略、回滚机制以及最终终止条件。
Skill 关注的是“局部能力”。
它像一个专业尖兵,只专注于把某个特定环节做到极致。比如:
- 执行“合同审查”时,应该按照哪份专业的检查清单(checklist)逐项审核。
- 进行“代码重构”时,标准的步骤是否是先扫描依赖,再审视测试用例,最后才修改实现代码。
- 做“简历诊断”时,应该从项目描述、技术栈匹配度、量化成果、岗位关键词等几个维度进行判断。
所以,Skill本质上是一个 “专业做法包” 。它不关心整条链路如何跑通,只负责在自己被调用的那个环节,把事情按照最高标准做好。

2. 粒度:完整业务目标 vs. 垂直能力模块
Workflow 粒度大,对应完整业务目标。
它通常是为了实现一个明确的、端到端的业务目标而设计的。例如:
- 完成一轮完整的AI面试。
- 将用户问题分流转发并最终生成答案。
- 自动生成一份市场分析报告。
这些都需要串联一系列连续的动作,是一个完整的“业务流程”。
Skill 粒度小,是可复用的垂直能力模块。
例如:
- 简历项目经验优化Skill
- 舆情摘要写作Skill
- 将某个专家的审核经验“蒸馏”封装成的Skill
你可以把Skill理解为一个高质量的 “可复用专家经验包” ,它在特定领域内提供专业能力。

3. 状态管理:管状态 vs. 不管状态
Workflow 必须管理状态。
它需要知道当前流程执行到哪一步了,上一步的输出结果是什么,中间步骤是否失败,是否需要切换到人工处理,整个链路是否已经完成。
因此,Workflow天然需要与状态机、任务上下文、运行日志、链路追踪和监控系统紧密绑定。
Skill 一般不管理状态。
它更像一个纯粹的“函数”或“能力单元”。调用时,你给它输入(和必要的上下文);执行后,它返回高质量的输出,或者指导调用它的Agent如何更专业地完成这一步。
Skill的重点不在于“运行流程”,而在于 在需要的时刻,为Agent补充正确的专业知识和操作指引。

4. 复用方式:业务级复用 vs. 能力级复用
Workflow 通常是业务级复用。
比如,一个精心设计的“客服工单处理Workflow”,通常深度耦合客服场景的业务逻辑。如果你想把它直接搬到“招聘系统”中使用,大概率需要推倒重做,因为业务目标和流程完全不同。
Skill 追求的是能力级复用。
一个好的Skill应该是跨业务场景通用的。例如:
- 一个“信息抽取Skill”,既可以用在客服场景分析用户意图,也能用在投研场景解析财报,还能用在简历筛选中提取关键信息。
- 一个“长文摘要Skill”,几乎可以被任何需要内容浓缩的场景调用。
- 一个“代码Review Skill”,可以同时挂在编程助手Agent、测试Agent、代码重构Agent下工作。
因此,一个健壮的 AI Agent 系统,其设计哲学不应是“疯狂堆积Workflow”,而应该是:用Workflow搭建业务的骨架和流程,用Skill封装和填充具体、可复用的专业能力。

5. 评估指标:链路指标 vs. 能力指标
评估 Workflow,看的是链路指标。
因为它是一个流程系统,我们关心其端到端的整体效率与可靠性。核心指标包括:任务成功率、平均处理耗时、执行成本、步骤重试率、人工接管率、整体任务完成率等。
评估 Skill,看的是能力指标。
因为它是一个专业能力模块,我们关心其专项能力的提升效果。核心指标包括:输出准确率、使用前后效果提升度、幻觉减少情况、输出格式稳定性、以及人工修正次数是否下降等。

面试场景如何回答?
掌握了以上区别,当面试官再问起这个问题时,你就可以给出一个结构清晰、体现深度的回答了:
“我会从系统设计的不同层级来理解Workflow和Skill。
- Workflow 侧重于任务的编排与推进,它负责定义步骤顺序、处理分支逻辑、管理执行状态、控制重试与回滚,确保整个业务流程能够顺利完成。它关注的是‘如何把事做完’。
- Skill 更像是封装好的、可复用的专业能力单元,它沉淀了在特定领域(如代码审查、合同分析)的最佳实践、规则、模板或脚本。它关注的是‘如何把某一步事做好’。
因此,简单说,Workflow 偏重‘过程控制’,而 Skill 偏重‘能力增强’。在一个良好的 AI大模型 应用架构中,通常用Workflow来串联业务流程,同时调用多个细粒度的Skill来完成具体任务。”
总结与思考
很多开发者在初次设计AI Agent系统时,容易把Tool、Skill、Workflow、Memory这些概念混为一谈。虽然它们都与Agent相关,但各自承担着不同的职责。
从传统开发转向AI应用开发,思维需要升级。决胜的关键不再仅仅是写页面、调接口,更在于能否理解并驾驭 “流程编排、状态管理、工具调用、能力封装、记忆沉淀” 这一套新的设计范式。清晰地区分Workflow和Skill,正是迈入这扇大门的必修课。如果你在准备相关的 面试求职,不妨多在云栈社区这类技术论坛上看看大家的实践经验,能帮助你更好地理解这些抽象概念。