
上次那篇《一文讲透 Prompt、Agent、Skill》发完之后,没想到用“开公司”的比喻帮很多人搞懂了基本概念。
但搞懂之后,新的问题来了。
被问最多的就三个:
“OpenClaw 里面这些概念是怎么配合的?大模型跟 Agent 到底啥关系?”
“Token 到底是什么?为什么我用着用着就要花钱了?”
“飞书机器人又是什么?AI 真能在飞书里帮我干活?”
哦对了,还有一个被问爆了的——“Claude Code 跟 OpenClaw 到底是不是一回事?”这个我也会顺便说清楚。
今天,我们用一个新的故事来解答——你开了一家餐厅。
先把对照表放这儿,你扫一眼有个印象,然后我们一个一个拆。
| 技术概念 |
餐厅里的角色 |
一句话 |
| OpenClaw |
你开的这家餐厅 |
能接单、能做菜、能外卖的智能餐厅 |
| 大模型(LLM) |
大厨 |
手艺精湛,但你得告诉他做什么菜 |
| Token |
食材 + 燃气 |
大厨每做一道菜都要消耗食材和燃气——这就是成本 |
| Agent |
大厨“自己看单出菜”的工作模式 |
不用你每道菜都喊一嗓子,他自己看菜单自己做 |
| Skill |
菜谱 / 标准化流程 |
宫保鸡丁怎么做、红烧肉放多少糖——写下来的标准做法 |
| 飞书集成机器人 |
外卖平台接单窗口 |
客人在美团下单,后厨直接收到 |
话不多说,开始。
OpenClaw = 你开的这家餐厅
假设你开了一家餐厅。不是路边摊,是一家正经的有后厨有前台有外卖渠道的餐厅。能堂食,能外带,还接美团和饿了么。
这家餐厅,就叫 OpenClaw。
OpenClaw 是什么?一个开源的 AI Agent 平台。你可以把它想象成——一个让 AI 不只是陪你聊天,而是真正替你干活的基础设施。
这玩意有多火?GitHub 上 302,000+ Star,60 天超越了 React 十年的纪录。 你没看错——React 积攒了十年的 Star 数,OpenClaw 两个月就超了。
Sam Altman 管 OpenClaw 的创始人 Peter Steinberger 叫“a genius with amazing ideas about the future of very smart agents”。今年 2 月,Steinberger 宣布加入 OpenAI,OpenClaw 移交给了开源基金会——意味着这个项目不会被任何一家公司吃掉。
但数据和背书都不重要。重要的是一句话——
以前的 AI 只会帮你说话,OpenClaw 让 AI 帮你干活。
为什么用“餐厅”来比喻?因为一家餐厅要运转起来,需要大厨、食材、菜谱、点餐渠道。缺一样都转不起来。OpenClaw 也一样——大模型是大厨,Token 是食材,Skill 是菜谱,飞书是外卖窗口。
对了,这里顺便回答一个被问爆了的问题——
“Claude Code 跟 OpenClaw 是什么关系?”
一句话:根本不是一个物种。
OpenClaw 是一家餐厅——它本身不做菜。它负责接单、派活、管渠道。做菜的是它请来的大厨(大模型)。
Claude Code 是一个大厨——它本身就是那个干活的 AI Agent。你打开终端跟它说“帮我重构这个项目”,它自己读代码、自己改、自己跑测试。不需要餐厅,它直接上门给你做。
这是最本质的区别——一个是管理系统,一个是干活的人。
再往深拆一层:
OpenClaw 是一家 24 小时营业的智能餐厅。你部署好之后,它就一直开着——飞书来单接飞书,钉钉来单接钉钉,后厨今天请 Claude 明天换 GPT。你人睡了,餐厅还在接单做菜。它是基础设施。
Claude Code 是 Anthropic 做的一个智能体 CLI——大厨 Claude 本人,背着工具箱上门服务。你打开终端(开门),说一句话(点菜),他就在你的电脑里直接开干。做完了,关终端(送客),大厨走人。它不是平台,不需要部署,不需要服务器——它就是那个 Agent 本身。
一个是永不打烊的餐厅。一个是随叫随到的大厨。
所以——你想搭一个 AI 中台,让飞书群里的同事随时@机器人干活?用 OpenClaw,因为你需要一家 24 小时开着的餐厅。你是开发者,想让 AI 帮你写代码管项目?用 Claude Code,因为你需要的是大厨亲自上门。
这玩意甚至可以配合着来——用 Claude Code 研发菜谱(Skill)(因为他的内置 agent 能力非常强),然后部署到 OpenClaw 餐厅里 24 小时跑。一个负责研发,一个负责运营。
搞清楚了?好,回到我们的餐厅——接下来,一个一个拆开讲。
大模型 = 大厨
餐厅最核心的人是谁?大厨。
OpenClaw 最核心的东西是什么?大模型。
大模型,就是你经常听到的那些名字——GPT、Claude、DeepSeek、Gemini。它们是 AI 的大脑,是真正“会思考”的部分。
但这里有一个很多人搞混的点——
OpenClaw 自己不是大模型。
OpenClaw 是餐厅。大模型是你请来的大厨。“这就像你的餐厅本身不做菜——做菜的是你雇的厨师。”OpenClaw 负责接单、管理、调度;大模型负责“动脑子”。
更妙的是——你的餐厅可以换厨师。OpenClaw 支持你随时切换大模型。不满意 Claude 的手艺?换 GPT。GPT 太贵?换 DeepSeek。甚至可以在你自己的电脑上跑一个本地模型——完全免费,只是手艺可能差一点。
菜单不变,食客无感。这就是 OpenClaw “智能与 Agent 分离”的设计哲学。有人说这叫“主权个人 AI”——你的 AI,你做主,不被任何一家大模型厂商绑架。
确实挺酷的。
但大厨再厉害,也需要一样东西——食材。没食材,巧妇难为无米之炊。
在 AI 世界里,这个“食材”有一个专门的名字——Token。
Token = 食材 + 燃气
大厨做菜,要消耗食材。食材用完了,就得再买。
大模型干活,要消耗 Token。
Token,就是 AI 的食材。大模型每“思考”一次,就要消耗一批 Token——这就是你用 AI 产生费用的根源。
先说最基本的:Token 到底是什么?
很多人以为 Token 就是“字数”。不是。
Token 是大模型切割文本的最小单位。就像厨师切菜——不是按整颗白菜算,是按切好的丝或段算。
一个中文汉字大约等于 0.7-2 个 Token。一个英文单词大约等于 1-1.5 个 Token(这里是个范围是因为不同厂商的中文支持或者编码方式有些区别,这里不深入了哈~)。
你跟 AI 说“帮我写一篇文章”这七个字,在后台已经被切成了十几个 Token。
你问 AI 一个问题,AI 回你一段话——一来一回,两笔 Token 都在烧。所以一般来说,计费也分输入 token 和输出 token 单独计费。
到这里,你只需要记住一句话——跟 AI 的每一句对话,都在烧 Token。说也烧,听也烧。
再深一层:Token 怎么计费?
知道 Token 是什么了,下一个问题——多贵?
Token 分两种:输入 Token(你给 AI 的内容)和输出 Token(AI 回你的内容)。
关键来了——输出 Token 的价格大约是输入的 8 倍。以 Claude 模型为例,输入 $1.25/百万 Token,输出$10.00/百万 Token。
用餐厅的话说——买食材不贵,大厨的加工费才贵。
记住这个 8 倍。下面马上用到。
搞懂计费后,看一个反直觉的例子。
我自己测试下来:让 AI 总结一篇维基百科要花 $0.18。但让 AI 写一个完整的前端页面只花 $0.033。
等等,写代码比读文章便宜?
没错。现在你能理解了——总结维基百科,你喂进去一大篇文章,输入 Token 巨多;写缓存系统,你只说一句“帮我写个缓存”,输入极少。输入 Token 虽然单价便宜,但量大的时候也吃不消。
你以为“写代码”最贵?不,“读材料”才贵。
最让人后背发凉的数字。
前面说的都是单次调用。现在来看连续对话——这才是 Token 消耗的终极黑洞。
OpenClaw 还没开始干活,光是加载系统提示词,就已经消耗了大约 8,000 个 Token。 还没点菜呢,灶已经烧上了。
然后——跟 OpenClaw 聊 10 轮对话,成本是第 1 轮的 26 倍。
不是 10 倍。是 26 倍。
说实话,看到这个数字的时候我愣了一下。因为每一轮对话,前面所有的对话历史都要重新“投喂”给大模型。相当于大厨每做一道新菜,都要把前面所有菜重新看一遍。
宏观数据更夸张。2026 年 2 月,中国大模型 Token 调用量首次超过美国,日均消耗达到万亿级别。这玩意已经不是小众概念了——它是整个 AI 世界的硬通货。
怎么省 Token?
说了这么多,你肯定想问——那怎么省?
三条实用建议,由简到难。
第一,定期“清台面”。用 OpenClaw 的 /compact 命令压缩对话历史。就像大厨台面太乱了影响效率——清一下,只保留关键信息。这是最简单的一招,立竿见影。

第二,Skill 描述写短一点。Skill 的描述每次调用都会被加载——描述越长,每次消耗的 Token 越多。够用就行,别写小作文。
第三,换小厨师干小活。简单任务(聊天、翻译)用便宜模型,复杂任务(写代码、做分析)才上贵的。别让米其林大厨帮你煮泡面。
第四,Coding Plan。这是多家厂商专门服务于这种 agent 场景的包月的订阅功能。大致就是每 5 个小时给你一定的额度,5 小时内用完就没了,但是过了之后又刷新。强推这种。
省 Token 的核心逻辑:让大厨只在该出手的时候出手,别让他切个葱也用龙泉宝刀。
好,食材有了。大厨手艺也有了。
但大厨怎么干活?是你站在旁边一道一道菜地喊,还是他自己看着订单做?
这就涉及到下一个概念——Agent。
Agent = 大厨“自己看单出菜”的工作模式
如果你开餐厅,你肯定不想每道菜都站在大厨旁边喊——
“现在做宫保鸡丁!”
“好了好了,现在做酸菜鱼!”
“等等,那个红烧肉先别放酱油!”
你想的是——单子贴在窗口,大厨自己看着做。
这种“自己看单、自己拆解、自己干活”的工作模式,就叫 Agent。
上篇我们讲过——Agent 不是一个产品名字,是一种工作模式。你不能“下载一个 Agent”。
在 OpenClaw 里,Agent 是默认的工作方式。你给它一个任务——它自己拆解、自己规划、自己执行、自己检查。
你给目标,它给结果。
举个最简单的例子感受一下。你跟 AI 说:“帮我把这段英文翻译成中文。” 它翻了。——这还不算 Agent,这只是“你说一步它做一步”。
你跟 OpenClaw 说:“帮我写一份竞品分析报告。” 它自己去搜竞品信息,自己整理对比维度,自己组织语言,最后生成一份完整的报告。——这才叫 Agent。
工具是你说一步它做一步。Agent 是你给目标,它自己拆步骤。

搞懂了 Agent 的基本逻辑,再来看 OpenClaw 把它玩出了什么花样。
第一,多 Agent 协作。 不是一个大厨单打独斗——是一个主厨带着几个副厨一起干。OpenClaw 可以同时派出多个 Agent 并行处理不同的子任务。你让它做一份报告,它可能同时派一个 Agent 搜资料、一个 Agent 整理数据、一个 Agent 写初稿。主厨切肉的时候,副厨已经在调酱汁了。
第二,事件驱动。 OpenClaw 不是一个 24 小时在那转的“智能体”——它更像一个高效的守护进程,有客人点菜才开火。没人点餐的时候,它就安安静静待着,不烧一分钱燃气。
第三,记忆系统。 你的老顾客喜欢少辣多醋?大厨记住了。下次这位顾客来,不用再交代——直接按喜好出菜。OpenClaw 的记忆系统让 AI 能记住你的偏好和习惯,越用越顺手。
大厨能自己干活了。但如果每道菜都要他从零开始想——效率太低了。
所以你需要给他一样东西——菜谱。
Skill = 菜谱
菜谱是什么?标准化的做菜流程。
宫保鸡丁:鸡胸肉切丁、花生油爆香、加干辣椒和花椒、最后勾芡。一步一步写清楚,新手照着做都不会太离谱。
在 OpenClaw 里,这种写下来的标准化流程,就叫 Skill。

Skill 在 OpenClaw 里长什么样?说白了就是一个文件夹,里面放一个 SKILL.md 文件。用 Markdown 写的“操作手册”——告诉 AI 遇到某类任务该怎么做、按什么步骤来、注意什么细节。
不需要写代码。会写文字就够了。
Skill 可以很简单——一句“遇到英文翻译成中文,语气自然不要翻译腔”就是一个 Skill。
也可以很复杂——“每周五自动生成团队周报,从飞书文档提取本周更新,按项目分类,标注风险项,推送到指定群组”——这也是一个 Skill,只是菜谱更长。
菜谱写得越细,大厨出品越稳。
上篇讲 Skill 的时候我说过一句话——你的 Skill 库越厚,AI 干活的质量越稳定。 这句话在 OpenClaw 的世界里更明显。
OpenClaw 内置了 49 个 Skill,官方仓库 93 个,社区贡献了 13,729+ 个。
13,729 个是什么概念?就像一个餐饮连锁集团——总部有一个巨大的菜谱库,从川菜到粤菜到西餐到甜品,你想做什么菜,去翻就是了。任何一家分店拿过去就能用。
不过有一点要提醒——菜谱多是好事。但来路不明的菜谱,可能比没有菜谱更危险。 这也就是最近大家比较关注的安全问题。
到这里,你的餐厅有了大厨、食材、菜谱,大厨也能自己看单干活了。
但问题来了——客人在哪?你的餐厅再好吃,客人得找得到你才行。
对很多人来说,最常用的“渠道”,就是飞书。
飞书集成机器人 = 外卖平台的接单窗口
你的餐厅再好吃,如果只能堂食——生意永远做不大。
你得上外卖平台。美团、饿了么、大众点评——客人在平台上点一下,后厨直接收到订单,做好了骑手直接送。
飞书集成机器人,就是 OpenClaw 的“美团接口”。
OpenClaw 支持 22 个以上的消息平台——WhatsApp、Telegram、飞书、钉钉、Slack、Discord,甚至微信(通过社区插件)。但对国内用户来说,飞书是最甜的那个点。
你在飞书里 @机器人,OpenClaw 就开始干活。
这意味着什么?三个场景,从简单到复杂,你感受一下。
场景一:问一句答一句。 收到一份英文合同,直接丢给飞书里的 OpenClaw 机器人——“翻成中文,标出关键条款。” 三分钟后翻译好的版本出现在聊天窗口里。最简单的用法,@一下就完事。
场景二:帮你干一整件事。 你把这周的飞书文档、会议纪要、项目进展@给机器人——“整理成给老板看的周报。” 五分钟后,一份格式完整、重点突出的周报就出来了。不是翻译一段话,是帮你完成一个完整的任务。
场景三:你不说话它自己干。 你定了一个 Skill——每天早上 9 点,自动搜集行业新闻、竞品动态、股价变化,整理成一份简报,推送到飞书群里。你端着咖啡打开飞书,今天要关注什么,一目了然。完全不需要人工触发。
技术门槛有多低?
飞书免费版就能用。 不需要企业版。
WebSocket 长连接——不需要公网 IP。你的电脑连着网就行,不需要买服务器、不需要搞域名、不需要备案。你的电脑开着,机器人就活着。
对大多数人来说,最明显的体感是 AI 终于来到了我日常干活的地方。以前用 AI,你得专门打开一个网页、一个 App、一个终端。现在不用了。你在飞书里跟同事聊着天,想让 AI 帮忙,直接@它就行。
OpenClaw 最厉害的地方——它不是让你去适应 AI,它是让 AI 来到你的工位旁边。
好,所有角色都到齐了。现在让我们看看——这家餐厅完整运转起来,是什么样的。
当所有角色就位——一个完整的场景
周一早上 9 点,你打开飞书。群里@了 OpenClaw 机器人:“帮我整理上周的项目进展,生成一份给老板的周报。”
然后你去接了杯水。
来,我帮你拆一下这背后发生了什么。
- 飞书机器人(外卖窗口)收到了你的订单——把消息传给了 OpenClaw。
- OpenClaw(餐厅)接到订单——启动 Agent 模式。
- Agent(自己看单出菜)开始拆解任务——“先读飞书文档,再整理要点,最后写周报。”
- 它发现你有一个叫“周报生成”的 Skill(菜谱)——自动加载,按标准流程来。
- 大模型(大厨)开始干活——阅读文档、提取关键信息、组织语言、生成周报。
- 整个过程消耗了一批 Token(食材+燃气)——读文档消耗输入 Token,写周报消耗输出 Token。
5 分钟后。
一份格式完整、重点突出的周报出现在飞书里。你端着水杯回来,低头一看——好了。
不是任何一个环节有多牛——是它们咬合在一起转起来的时候,效率的量级变了。
飞书给了入口,OpenClaw 给了调度,Agent 给了自主性,大模型给了智能,Skill 给了标准,Token 支撑了整个运转。
六个齿轮,一台机器。
上篇开了公司,这篇开了餐厅
回头看这两篇——
上篇讲的是概念本身。Prompt 是什么、Agent 是什么、Skill 是什么、MCP 是什么——一个“开公司”的故事,帮你认清每个概念的脸。
这篇讲的是概念之间的关系。大模型和 OpenClaw 是什么关系?Token 从哪来到哪去?Agent 和 Skill 怎么配合?飞书怎么串进来?——一个“开餐厅”的故事,帮你看清每个角色怎么协作。
两篇看完,你再跟人聊 AI——至少这些概念,你说得清楚了。而且你会发现一件事——你不需要懂什么大模型架构、什么 Transformer 原理、什么 Token 编码算法。你只需要知道——它能帮你干什么,你需要付出什么成本。
大厨的厨艺,你不需要比他更懂。你只需要知道——这家餐厅靠不靠谱,菜好不好吃,值不值这个价。
如果你读完觉得终于搞懂了,可以分享给身边有同样困惑的朋友。如果你还没尝试,不妨动手试试。AI 的世界,从来不是某一个概念的独角戏,它是一整桌大餐,等着你开席。想了解更多技术实践和深度讨论,欢迎来云栈社区交流分享。