学不完,真的学不完。

过去几天,各路 AI 模型、AI 产品轮番炸场,几乎没有消停过。其中 Moltbot(原 Clawdbot)更是登上国际头版头条,刷屏硅谷。GitHub 上几乎垂直向上的 star 曲线,Mac mini 被卖爆,Discord 服务器被挤爆……这一切发生得太快了。

更魔幻的是,这背后根本不是什么初创公司,也不是团队作战,就是 Moltbot 创始人 Peter Steinberger 一个人在家里折腾的成果。
Peter 最近也接受了外媒 TBPN 的采访。接受采访的时候,欧洲那边已经是晚上 11 点了。但他看起来依旧挺精神,哪怕过去 72 小时,他可能都没怎么好好睡过。

附视频地址 🔗: https://x.com/tbpn/status/2016299976360656970?s=20
从精疲力尽到「又上头了」
Peter 的剧本开头,像极了硅谷爽文。四年前,他卖掉了经营 13 年的软件公司,实现了财富自由(赚了一亿欧元)。按理说,接下来的人生应该是游艇、香槟和永无止境的假期。他也确实这么做了,整整放空了三年,甚至自嘲像《奥斯汀·鲍尔斯》里被抽走了「动力」的倒霉蛋。
“可能 13 年连轴转之后休息个一年差不多,但我直接休了三年,好像也说得过去吧。”
直到去年 4 月的某个时候,他重新调整状态,开始退休复出,专心研究 人工智能。巧的是,他刚好错过了 AI 特别糟糕的那三年,回归的时候正好赶上 Copilot 这些代码生成工具开始内测。
第一次体验之后,他就开始失眠了,凌晨四点给朋友发消息,没想到屏幕那边的朋友同样上头,秒回信息。Peter 甚至还办了个线下聚会,起名叫「Claude Code Anonymous」,现在已经改名「Agents Anonymous」(智能体匿名会)了,得与时俱进嘛。
一个小时搞定的 WhatsApp 接口,意外引发的「啊哈时刻」
学新技术最好的方式,就是玩中学。Peter 做项目的逻辑很简单:我要玩得开心。所以他经常做一些小东西,试不同的编程语言、不同的方式。甚至有个项目做了两个月,最后不得不停下来,因为这东西变得太好用了。他和朋友在外面玩,结果还能拿着手机继续用 Claude Code 搞项目。
“这对我的心理健康太不利了,我这不是在做一个让我更容易上瘾的工具吗?”
去年 11 月的某一天,他突发奇想:能不能通过 WhatsApp 跟电脑互动?如果智能体没在运行,而他自己在厨房晃悠,还想检查下它们的状态,或者发点提示词给它们。

于是他随手搞了个 WhatsApp 接口:接收消息、调用 Claude Code,然后返回结果。一小时搞定,而且能用。
平时发 prompt 的时候,除了文字,还会加张图片,因为图片经常能提供大量上下文信息,而且你就不用打那么多字。所以我觉得这是个能让 prompt 更快的「黑科技」——直接截图。智能体其实很擅长从图片中猜出你想要什么,于是我又顺手搞了图像支持。
后来他去马拉喀什玩了个周末生日旅行,发现自己用这功能的频率比预想的还高,不过不是用来写代码的,更多是找餐厅之类的事。
有一次他甚至直接发了段语音消息给它。但其实他根本没实现语音功能,结果十秒钟后,它像什么都没发生一样回复他了。Peter 当时简直震惊了:「你到底是怎么做到的?!」
它回复说:「我发现你发了个没后缀的文件,查了文件头发现是音频。我打算用你 Mac 里的工具转码,结果没装好报错了。但我翻到了你的环境变量里有 OpenAI 的 API Key,于是我直接 curl 给了 OpenAI 拿到了转录。接着我就回复你了。」
那一刻,真切让 Peter 感受到了「啊哈」时刻。

从那以后 Peter 就彻底上头了,开始搞各种奇奇怪怪的东西。比如他还搞了一个闹钟系统,让智能体「迁移」到他在伦敦的电脑上,然后远程登录到他家 MacBook,把音量调高来叫醒他。
“我可能做了全世界最贵的闹钟。”
不过它也是出过差错,因为这个闹钟是用心跳信号来判断状态的。对 Peter 来说,这个项目既是技术探索,也是某种艺术创作。一方面它把已有的技术拼接在一起;但另一方面,它又彻底改变了你与这些技术交互的方式,因为所有技术细节都「隐身」了。
你不用再去考虑什么对话压缩、模型选哪个,虽然也许偶尔还是会想一下,毕竟 token 还是挺贵的。但大多数时候你不会去管这些了,你只是在和一个「朋友」或者「幽灵」对话而已。
技术圈没 get 到,非技术朋友却说「我想用」
Peter 看似「一夜成名」,其实在爆红前也做了很多的准备工作。

比如他发现很多现在做的 MCP(Model Context Protocol,模型上下文协议)工具都挺烂的,扩展性也差。但他发现,智能体懂 Unix,可以在电脑上调用几千个小程序,只需要知道程序名,调用 help 菜单,加载需要的内容。因此,聪明的做法是按照模型的思维方式去开发,而不是按人类的习惯。
你要按照它们的思维方式去构建系统,这样一切运转得会更好。从某种意义上来说,这是一种全新的软件形态。
他还做过一个关于 Google Maps 地点管理的工具,接入了音响、家庭摄像头、智能家居系统……这些东西都是通过小型 CLI 工具和技能组合起来的,智能体的能力越来越强,也越来越好玩。
其实在那个 WhatsApp 集成功能时,他就已经完全沉迷进去了。他觉得这东西太神奇了,于是就在 Twitter 上分享。平时他发项目,都会有很多反馈。但那次,反应却很平淡,好像大家没 get 到。
他拿去给朋友看,甚至是那些不搞技术的朋友,他们却很感兴趣,直接就说想用。所以他感觉自己确实搞出了点什么,只是技术圈的人一开始没意识到而已。
于是他就继续试着打磨它,因为自己用得很爽。归根结底,他是为自己而做的这个工具。“这是开源的,我的动机就是好玩,能激发别人去尝试,而不是为了赚钱。我已经赚够了,不差钱。”
过去 72 小时:从 Discord 到改名风波
然后就是那个「爆炸」时刻。Twitter 上的热度直接把 Discord 服务器挤「炸」了,用户数量以一种他从未见过的速度在增长。Instagram 他都快处理不过来了。有段时间他只能把 Discord 上的问题复制粘贴到 Codex 里,让它生成回答,然后再复制出来继续回复下一个问题。
到后来,实在没法应付了,他干脆把整个频道复制下来,让模型回答最常见的 20 个问题。他再简单浏览一遍,给它几个额外指令,然后就直接发出来了。
“人们可能没意识到,其实这背后根本不是一个团队,也不是一家公司,就是我一个人,在家里玩得开心而已。”
伴随着 Clawdbot 的爆火,他收到了 Anthropic 的一封邮件,要他把项目名字改掉。不过,Anthropic 没直接找律师,而是内部有人来沟通。但由于时间线实在有点紧张,且在项目已经这么火的时候去改名,这无异于一场灾难,也因此在社交媒体引发了轩然大波。

模型这么多,最爱还是它
当被问到怎么看 Mac mini 时,Peter 笑着说:「我的智能体有点『公主病』,它不喜欢用 Mac mini。它想要更多性能。」最后他给智能体配了一台顶配的机器:512G 存储、各种配置拉满,因为他还想折腾本地模型。
“现在我可以在这台机器上跑 MiniMax 2.1,我觉得这是目前最好的开源模型之一。不过说实话,一台机器跑不太够,也不够有趣。你可能至少需要两台甚至三台机器。”
采访主持人提到,Moltbot 爆火浪潮中最有意思的一点,不只是 AI 智能体本身,而是大家第一次看到大型科技平台之间「被迫打通」。
Peter 觉得现有的运营模式会被被迫改变。比如你想要访问 Gmail API,繁琐手续多到你想不到。甚至有些初创公司为了获得权限,干脆直接收购另一个已经有许可证的公司。但如果在本地运行这些工具,就可以绕开这些障碍。
Peter 之前做了很多「破解式操作」,比如直接让 AI 去解析某个网站,然后生成一个「镜像版本」出来。
“AI 有时会拒绝,说这个操作不被允许,我就会『编个故事』给它听。讲几句『故事』之后,它大概 40 分钟内就能给你一个完美的 API。这在某种意义上,这恰恰是大公司不愿看到的。”
甚至像他做的 WhatsApp 集成,本质上也是钻了平台的空子,模拟的是桌面端协议。当时他尝试过官方途径,但官方方案只对企业开放,而企业发了 100 条消息之后就会被封号。
“我真的就被封了……后来我气得直接把那部分代码删了,一堆感叹号!因为现在根本没有一个合理的模式来支持这样的行为,而这是必须要改变的。”

不过,聊到模型的时候,Peter 说从「个性」层面出发,他最喜欢的依旧是 Claude Opus。
“我不知道他们的模型训练数据用了多少 Reddit 这类平台的内容,但它在 Discord 里的表现真的特别好。”他还专门给了它一个「可回复 / 不回复」的选项,所以它不会刷屏,而是「倾听」对话内容,然后时不时来一条「神回复」。
“有时候真的会让我笑出声。你知道,这其实挺难得的,因为大多数 AI 的笑话都很尴尬。但我只有在用 Opus 时才真正体验到『它懂幽默』这种感觉。”
在编码方面,他更喜欢用 Codex,因为它能很好地处理大型代码库。OpenAI 的模型呢?“非常稳定可靠,甚至可以说比很多人类员工都更靠谱。”
Peter 还认为,随着这种高度个性化的系统出现,大批垂直类 App 将迎来灭顶之灾。

“比如说,我还需要 MyFitnessPal(一款健康 App)干嘛?我拍一张我食物的照片,我的智能体已经知道我在麦当劳、正在做出糟糕的选择了。它结合上下文信息,能完美判断我吃的是什么,大概摄入了多少热量,甚至能自动调整我的健身计划。”
在他看来,智能体会直接根据他的生活状态调整计划。“我预期会有一大批 App 被淘汰。因为我们与系统的交互方式已经变了,它们会自然地变成『一个 API』。”
「能力越大,责任越大」
现在 Peter 收到了很多来自安全研究员的邮件。因为他当初做这个工具只是为了自己玩,自己用,在 WhatsApp 或 Telegram 上一对一聊天用的。
可现在有人把它用到了不该用的地方。他收到一堆又一堆的报告,有些确实发现了真问题,有些虽然技术上说得通,但压根儿不是他当初设想的使用方式。
“整个系统就像崩了一样。我是一个人做这个项目的,出于兴趣。而现在却要我去处理上百条关于安全问题的报告,还是针对那些我根本没考虑要支持的使用场景的。我也不知道怎么办,只能先走一步看一步吧。”

还好,他现在开始组建一个小团队了。
“这个系统确实有一定风险,我在官网上已经非常明确地说明了,甚至在你开始使用前,系统会提示你务必阅读一份文档。”
他相信这个项目会加速相关研究,因为它已经引发了真实的需求。像 Prompt Injection(提示词注入)这种核心问题,现在整个行业都还没解决,可能没有哪家公司敢直接碰这个项目。但他的早期用户都理解这一点,其中还有很多 AI 研究者。他们知道现在还不可能做到完美。
当被问到会不会成立公司时,Peter 说:“我觉得,与其成立公司,我更倾向于做一个基金会,我喜欢非营利的形式。”

关于开源许可证,他的想法是:让开源版本本身好到,别人也没太多空间再去改造它赚钱。他用了像 MIT 这类比较宽松的许可证。
是的,这意味着会有人拿去卖,但归根结底……这其实也没那么重要。代码本身现在已经不那么值钱了。你完全可以删了它,然后一个月再重写一遍。现在更重要的是创意、本身的关注度,以及它的品牌。这些才是真正有价值的。所以,随他们去吧。
访谈最后,Peter 还在线发 offer。他表示,真的非常希望能找到一些维护者,如果有人热爱开源、有经验、喜欢处理安全报告,或者擅长拆解软件、还能帮助修复问题,那请发邮件给他吧。
我一个人已经快到极限了。我希望这个项目能在我之后继续活下去。我觉得它太酷了,不应该被搁置。它需要志同道合的人来延续。
这个故事不仅展示了 AI 技术的快速演进,也体现了个体开发者在开源实战中的巨大潜力。如果你对这类技术探索感兴趣,不妨来 云栈社区 和更多开发者交流心得。