上周刷 GitHub 的时候,被一个叫 OpenClaw 的项目刷屏了。19 天 127K Star,这增长速度有点离谱。
点进去一看,好家伙,这玩意儿不是又一个套壳聊天机器人,而是真的能让 AI "动手"的系统。
先说个真实场景
你有没有遇到过这种情况:
早上醒来,手机里躺着 50 封未读邮件。老板的、客户的、广告的、订阅的,全混在一起。你得一封封点开,判断重要性,标记分类,回复紧急的……光这一套流程就得半小时。
现在,你在 WhatsApp 上给 AI 发一句:"帮我处理一下邮箱"。
然后它真的登录你的 Gmail,把邮件按优先级分好类,紧急的标红,垃圾的归档,还把需要回复的列了个清单发给你。
这就是 OpenClaw 在做的事。不是"帮你想怎么处理",是"直接帮你处理"。
它到底能干啥?
看了一圈用户案例,发现这东西的玩法有点野:
日常场景:
- 📧 自动清理邮箱,按规则归档分类(再也不用手动点删除了)
- ✈️ 监控航班动态,到点自动值机(不用定闹钟怕错过了)
- 📅 "下周三下午约个会",它自己去日历找空档,发邀请
- 🛒 拍张超市货架照片,它识别商品价格,生成购物清单
硬核场景:
- 🍷 有人用它管理 962 瓶红酒的收藏数据库(CSV 文件,带产地年份评分)
- 💻 代码 PR 提交后,自动审查并把建议推送到 Telegram
- 📝 搭配 Lobster 工作流,做个人知识库的自动整理和周回顾
关键是,所有数据都在你自己的服务器上跑,不经过第三方。
技术上是怎么实现的?
作为技术号,得说说架构。OpenClaw 的设计思路挺清晰:
Gateway:消息中枢
所有消息平台(WhatsApp、Telegram、Discord)都连到一个 Gateway,它跑在本地 127.0.0.1:18789,通过 WebSocket 和各个设备通信。
这样的好处是:你在手机上发的指令,电脑上的 AI 能接着处理,状态完全同步。
而且它支持 OAuth 订阅路由,意思是你可以直接用自己的 Claude Pro 账号,不用额外付 API 费。
Agent Loop:完整决策链
传统 AI 是"问-答"模式,OpenClaw 是"感知-决策-执行-反馈"循环:
收到消息 → 组装上下文 → 模型推理 → 调用工具 → 返回结果
它会动态管理 100K-200K 的长上下文窗口,工具调用结果实时流式返回。不同 provider 的账号还能路由到隔离的 agent 实例,互不干扰。
Memory:三层记忆系统
| 层级 |
干啥用的 |
| Session Memory |
记住这次对话说了啥 |
| Agent Workspace |
每个 agent 自己的工作目录 |
| Cross-Agent Memory |
不同 agent 之间共享信息 |
这套记忆系统不是简单的"检索历史消息",而是真的像人一样,知道"上次你说过要……"。
工具系统:AI 的"手"
OpenClaw 内置了 20 多个工具,覆盖了大部分日常操作:
read/write:读写文件
exec:执行命令(沙箱保护)
browser:控制浏览器(能模拟登录网站)
elevated:需要授权的高危操作
gmail-pubsub:监听新邮件
cron-jobs:定时任务
location_get:获取地理位置
安全方面做得还行:
- 本地执行,不走网络
- 沙箱模式自动禁用危险工具
- 可执行路径必须是绝对路径(防注入)
- 有超时和输出大小限制
技能系统:可复用的任务模板
这个设计挺聪明的。技能用 Markdown 文件写,放在特定目录下,系统会自动识别并注入到提示词里:
<available_skills>
<skill>
<name>Wine Cellar Manager</name>
<description>管理本地葡萄酒收藏数据</description>
<location>/home/user/skills/wine-cellar/SKILL.md</location>
</skill>
</available_skills>
AI 需要的时候,自己用 read 工具去读这个文件,按步骤执行。
有点像给 AI 写"操作手册",它照着做就行。
节点系统:连接真实世界
这个功能有点酷。你可以接入各种硬件设备:
- Camera:摄像头监控
- Audio:麦克风输入
- Location:地理位置(支持 iOS 后台定位)
- Voicewake:语音唤醒
- Talk:语音播报
想象一下:你出门的时候说"帮我盯着快递",家里的摄像头识别到快递员,自动通知你。
有人已经玩出花了
GitHub 上有个用户 bloomedai,用 OpenClaw 搭了个人知识管理系统:
- 三个 Markdown 笔记库(个人、伴侣、共享)
- 自动执行周回顾、收件箱分类、记忆整合、任务同步
- AI 负责判断分类,没 AI 的时候用规则兜底
项目开源了:https://github.com/bloomedai/brain-cli
怎么部署?
本地安装:
# Linux/macOS
curl -fsSL https://openclaw.ai/install.sh | sh
# Windows
powershell -Command "Invoke-WebRequest -Uri 'https://openclaw.ai/install.ps1' -OutFile 'install.ps1'; .\install.ps1"
容器化:
- Docker 镜像
- Railway/Render 一键部署
- Nix 声明式部署
技术栈:
- Node.js ≥22 + TypeScript
- Baileys (WhatsApp)、grammY (Telegram)、Discord.js
- Pi (RPC mode)
- 沙箱隔离 + token 认证
开发者模式
支持 ACP 协议,可以接入 IDE 插件:
openclaw acp --url ws://127.0.0.1:18789 --token <your-token>
还有个 Dev Profile 模式,用双 --dev 标志启动,会自动生成隔离的开发环境:
pnpm gateway:dev
OPENCLAW_PROFILE=dev openclaw tui
遥测方面支持 OTLP 协议,可以导出指标、日志、追踪数据,方便监控调试。
为什么觉得这个项目有意思?
大部分 AI 项目都在做"更好的对话",OpenClaw 在做"真正的执行"。
它证明了几件事:
- AI 可以不依赖云服务:数据在本地,隐私可控
- Agent 需要持久化环境:不是无状态 API,是有记忆的系统
- 工具比对话更重要:能干活的 AI 才是好 AI
而且它是开源的,代码在 GitHub 上,文档写得也挺详细。想研究 Agent 架构的话,这是个不错的参考实现。
说实话,看到这个项目的时候,有种"AI 终于不只是聊天了"的感觉。
以前我们说 AI 助手,其实就是个"会说话的搜索引擎"。现在 OpenClaw 这种项目出来,AI 开始真的能"动手"了。
虽然现在还有很多限制,但方向是对的。
想了解更多 AI 开源项目和技术实践,可以看看云栈社区整理的 AI 学习路径。
Github 仓库: openclaw/openclaw
官方文档: docs.openclaw.ai
AI Agent 教程: https://yunpan.plus/f/29
TypeScript 教程: https://yunpan.plus/f/18
你觉得这种"能执行任务的 AI"会成为主流吗?或者说,你最希望 AI 帮你自动化哪个工作流程?
评论区聊聊?
《异或Lambda》观点: 今天的OpenClaw,是明天的个人AI基础设施。就像Linux之于服务器,OpenClaw正在定义Agent Runtime的标准。解放生产力,从拥有自己的AI运行时开始。🦞
关注《异或Lambda》,获取更多AI前沿技术解读与开源项目盘点。
标签: #OpenClaw #GitHub #AI_Agent #开源项目 #自托管AI #WhatsApp机器人 #个人AI助手