最近,一个名为 OpenClaw 的项目火得离谱,安装甚至需要排队,是不是有点夸张?它没有发布新芯片,也不是新框架,却因为其独特的“小龙虾”形象深入人心。
没错,就是那只你在深夜刷 GitHub 时,可能会被其 25 万以上星标闪到眼的 OpenClaw。因为它的 logo 是一只红色龙虾,核心功能模块叫“钳子”(claw),其迭代成长的逻辑也像龙虾蜕壳,所以社区亲切地称之为 “小龙虾”。
短短 4 个月,星标数突破 25 万,增长速度一度超过了 Linux。这已经不只是一个开源项目,更像是开源界的现象级顶流。
今天,我们就来聊聊这只“小龙虾”到底是什么,以及它为何能掀起如此波澜。
一、它不是大模型,而是大模型的“指挥官”
首先需要澄清一个普遍的误区:OpenClaw 并不是又一个 ChatGPT 或者更强大的语言模型。
它的宣传语非常直白:“the AI that actually does things” —— 真正能干活的 AI。
当前的很多 AI 大模型,更像是一位“嘴强王者”。你问它“如何将 Excel 数据录入 CRM 系统”,它能给你写出一份详尽的步骤指南,但最后一步永远是“现在请你手动操作”。OpenClaw 的不同之处在于,它为大模型装上了“眼睛、大脑、手和记忆系统”。它能够理解自然语言指令,自主规划任务步骤,直接操控你的电脑执行多步骤复杂操作,并在遇到错误时尝试自我纠正。
简单来说:过去的 AI 是军师,负责出谋划策;现在的 OpenClaw 是打工人,负责亲自下场干活。

二、四层架构,分工明确
OpenClaw 之所以能稳定、可靠地“干活”,得益于其清晰的四层架构设计。每一层各司其职,又紧密协作。

第一层:接入层(Gateway)—— 永远在线的指挥官
这一层统一对接 Telegram、飞书、企业微信、Discord 等各种聊天工具。你无需安装额外 App,在日常使用的聊天窗口里就能直接下达指令。它还负责任务队列的管理,默认采用串行执行方式,避免多个任务并发导致冲突。
第二层:大脑层(模型调度)—— 思考决策的中枢
OpenClaw 本身不生产智能,而是智能的调度者。它可以灵活接入 Claude、GPT、DeepSeek、通义千问乃至本地部署的开源模型。系统会根据任务类型,自动匹配最优模型:例如,数据核对选用逻辑能力强的 Claude,撰写邮件文案则切换至创作能力强的 GPT。这一层的核心职责是理解自然语言、拆解复杂任务、进行逻辑推理并最终决策下一步动作。
第三层:执行层(Skills)—— 动手干活的“钳子”
这是一个高度可扩展的功能插件(Skill)体系,支持官方提供、社区贡献以及用户自定义。通过调用操作系统的底层 API,它能实现文件管理、浏览器操控、办公软件自动化、代码编写等具体操作。每个命令都在独立的沙箱环境中运行,确保了执行过程的安全性。
第四层:记忆层(Memory)—— 可自主生长的记忆系统
所有对话历史、任务执行记录、用户偏好、技能参数等数据都存储在本地(用户设备或自有服务器),不会上传至任何第三方。这形成了系统的记忆:短期记忆服务于当前任务上下文,长期记忆则沉淀用户习惯,让 OpenClaw 越用越贴合你的个人需求。
三、核心工作流:感知-决策-执行-反馈
OpenClaw 完成任务遵循一个经典的 “感知(See)- 决策(Think)- 执行(Act)- 反馈(Feedback)” 循环。这个循环使其能在基本无需人工干预的情况下,自主完成多步骤的复杂任务——当然,目前的实现距离完全自主的理想状态还有进步空间。

让我们用一个真实场景来理解这个过程:你向它下达指令 「帮我把 Excel 里的客户信息录入公司 CRM 后台,再给每个客户发一封通知邮件」。
步骤 1:感知(See)
网关收到指令后,将其转发给智能体核心。智能体首先对电脑桌面进行截图,通过多模态大模型“看懂”屏幕内容:识别 Excel 文件的位置、CRM 系统的网页入口、邮箱客户端的图标等。同时,它开始读取 Excel 文件内的客户数据,明确本次任务的边界和目标。
步骤 2:决策(Think)
核心的 大模型 将这条复杂的自然语言指令,拆解成一系列可具体执行的动作步骤:
- 打开指定的 Excel 文件,提取所有客户信息(姓名、电话、邮箱等)。
- 打开浏览器,访问公司 CRM 后台网址并完成登录。
- 在 CRM 的录入界面,逐行粘贴客户信息,并核对关键字段。
- 打开邮箱客户端,按预设模板为每位客户生成并发送通知邮件。
- 任务完成后,生成一份简明的执行报告反馈给用户。
在此过程中,系统还会自动设置数据校验规则和异常处理预案,并根据当前步骤的特点(如需要严谨逻辑或需要创意文案)自动切换最适配的 AI 模型。
步骤 3:执行(Act)
智能体通过操作系统底层的 API,模拟人类的鼠标点击、键盘输入等操作,严格按照规划好的步骤执行:双击打开 Excel、复制单元格内容、在浏览器地址栏粘贴网址、在网页表单字段中录入信息、点击邮件发送按钮……每一个操作都在隔离的沙箱中运行,最大限度避免误操作影响到系统核心或其它程序。
步骤 4:反馈与纠错(Feedback)
每完成一个单步动作,智能体都会重新截图、读取系统状态(如当前打开的窗口、页面显示的文字),并与预期的结果进行比对:
- 如果执行结果符合预期,则顺利进入下一个步骤。
- 如果遇到意外情况(如弹出广告窗口、需要输入登录验证码、表单字段不匹配),它会自动识别问题所在,重新规划动作(关闭广告、在聊天窗口请求用户提供验证码、调整字段映射关系),然后重试直至该步骤完成。
整个任务结束后,它会整理一份完整的执行报告,包括成功/失败的条目数量、遇到的异常情况及处理方式,并通过最初下达指令的聊天窗口反馈给你。
这个“感知-决策-执行-反馈”的循环会持续迭代,直到任务目标完全达成。即使中途出现计划外的“意外”,它也有一定的自主纠错能力,无需用户从头到尾紧盯屏幕。
四、“养虾”热潮背后的硬核特性
OpenClaw 能迅速走红,离不开以下几个击中开发者与企业痛点的核心特性:
1. 本地部署,数据隐私可控
所有任务数据处理和执行过程都在你本地的电脑或自有服务器上完成,数据无需上传至第三方云服务器。权限完全由用户掌控,这极大地降低了敏感业务数据泄露的风险。在AI工具动辄“上传分析”的当下,这种设计无疑是一股清流。
2. 低使用门槛与高扩展性
对零基础用户友好,最快能在10分钟内完成部署,无需编程技能,用自然语言就能指挥它工作。同时,它支持强大的社区技能(Skill)扩展,你可以直接“白嫖”别人开发好的成熟技能包,也能基于文档轻松编写自定义技能。这意味着它的能力边界可以被无限拓展。
3. 递归式技能进化能力
当遇到一个从未定义过的任务时,OpenClaw 能够尝试自主编写实现代码、在本地沙箱中调试运行、自我修正错误,最终把成功的执行流程封装成一个标准化的技能文件。这相当于它能够自主学会新技能,越用越强大。这已经超出了传统“学习”的范畴,更像是一种“进化”。
4. 默认安全的设计哲学
系统默认采用串行方式执行任务,避免了异步编程可能带来的资源竞争和状态混乱问题。每一个具体操作都在独立沙箱中运行,且对系统资源的访问权限受到限制,这从设计上最大程度地降低了误操作和系统安全风险。
五、从“操作员”到“管理者”的范式跃迁
当然,OpenClaw 远非完美。它偶尔会“抽风”,误解一些指令,甚至在看似简单的任务上“翻车”。但它的出现和流行,揭示了一个更深层次的趋势变化:我们正在从“数字操作员”向“流程管理者”的身份跃迁。
过去,大量工作时间被无数琐碎、重复的低级操作占据:在不同应用间复制粘贴、往系统里录入数据、批量发送格式固定的邮件、整理和归档文件……这些工作并不复杂,却极其消耗人的精力和耐心。
现在,像 OpenClaw 这样的工具,正在试图将这些“脏活累活”承包下来。我们需要思考和提供的,不再是“具体每一步怎么操作”,而是“最终想要达到什么结果”以及“需要遵循哪些规则”。
这类似于工业革命将人从繁重的体力劳动中解放出来,而当前的 AI 革命,正致力于将人从重复性、规则性的脑力劳动中解放出来。未来的核心竞争力,可能不再是“你会不会操作某个软件”,而是“你是否能清晰地定义问题”、“能否进行有效的任务规划”以及“能否做出准确的决策”。
从任务的执行者转变为流程的指挥者,从自己干活的人变为调度机器干活的人。
这才是“小龙虾” OpenClaw 最值得期待和深思的地方。它不仅仅是一个提升效率的工具,更是一个强烈的隐喻:未来的工作模式,很可能不再是人类亲力亲为地操作,而是人类负责指挥和决策,由 AI 智能体负责具体的执行。
道路当然还很漫长。OpenClaw 仍处于快速成长期,像一只不断“蜕壳”的虾苗,能力在增长,也难免会有不稳定的时候。但只要方向正确,技术迭代的速度,从来不会让我们失望。
最后,想问一句广大的 开发者 朋友们:这只“小龙虾”,你开始“养”了吗?关于 AI 智能体的未来,欢迎来 云栈社区 分享你的看法和实践经验。