找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3687

积分

0

好友

507

主题
发表于 7 天前 | 查看: 40| 回复: 0

本文整理自 OpenClaw 创始人 Peter Steinberger 在 Lex Fridman 播客节目中的深度访谈,揭示了 AI 智能体的前沿实践与行业巨头的激烈竞争。

2026年初,一档时长超过3小时的深度科技播客访谈引发了业界广泛关注。MIT科学家、知名播客主持人 Lex Fridman 邀请的嘉宾,正是开源 AI 智能体框架 OpenClaw 的创始人 Peter Steinberger。

OpenClaw 创始人 Peter Steinberger 在 Lex Fridman 播客中

在这次对话中,Peter 不仅分享了 OpenClaw 从一小时原型到 GitHub 爆火的传奇经历,更首次透露了 Meta 与 OpenAI 两大巨头对其项目的激烈争夺,并抛出了关于软件行业未来的震撼预言。

从“一小时原型”到 GitHub 星标传奇

故事始于2025年11月。曾成功创立并出售了 PSPDFKit(一个拥有十亿级设备使用的 PDF 框架)的奥地利程序员 Peter Steinberger,在周游世界后重新被 AI 浪潮吸引。他最初只是想要一个个人 AI 助理,在等待业界方案未果后,决定自己动手。

“本质上就是把 WhatsApp 接到 Claude Code 的 CLI 上,” Peter 回忆道,“消息进来,我调用 CLI 加上 -p 参数,模型处理完,把字符串发回 WhatsApp。就这么简单。”

这个仅用一小时完成的原型,却成为了引爆点。其 GitHub 仓库 openclaw/openclaw 的星标数量随后呈现指数级增长。

OpenClaw 在 GitHub 上的星标增长历史图表

智能体的“自主进化”:未教先会的语音处理

让 Peter 本人也感到震惊的,是智能体展现出的“自主解决问题”能力。在摩洛哥马拉喀什度假时,他随手向智能体发送了一条语音消息,而智能体竟然给出了文字回复。

“我根本没有给它加语音支持功能,” Peter 检查日志后才发现,AI 在收到一个无扩展名的文件后,自主执行了一系列操作:检查文件头识别出 Opus 格式、尝试用 ffmpeg 转码、发现未安装 Whisper 后,转而利用环境中已有的 OpenAI API 密钥,通过 curl 将文件发送至 OpenAI 的语音转文字服务,最终将结果返回。

“我特么都没教它这些!” Peter 感叹道。这展现了现代 AI 模型不再是机械执行指令,而是具备了创造性的问题解决思维。

Peter Steinberger 描述 AI 自主处理语音消息

核心特性:能够理解并修改自身源码的智能体

OpenClaw 最引人注目的特性之一是它被设计为可以理解并修改自己的源代码。Peter 有意让 AI 智能体“知道”自己的身份:源码位置、运行环境、文档以及所使用的模型。

“我用我的智能体来构建我的智能体框架,” Peter 解释道,“需要调试时,我就说——嘿,你看到什么错误了吗?读一下源码,找出问题在哪。”

结果是,任何用户如果对某个功能不满意,只需告诉 AI,AI 就会自己去阅读并修改源码。“人们一直在谈论自修改软件,而我直接把它造出来了,甚至都没有刻意去规划。”

命名风波与“黄牛”狙击战

OpenClaw 的命名并非一帆风顺。其前身因名称与 Anthropic 的“Claude”相似而被要求改名。在 Peter 申请的两天缓冲期内,一场与域名/账号黄牛的赛跑开始了。

“我在两个浏览器窗口之间操作,一边把旧账号改名,一边准备注册新名字。我先在这边点了重命名,然后把鼠标拖到那边点重命名——就这5秒钟的间隔,黄牛就抢走了旧账号名。” 被抢走的账号立刻被用于推广加密货币和恶意软件。随后,他的个人 GitHub 账号名、NPM 包名也在操作失误中被抢注。

描述 OpenClaw 改名过程的幽默梗图

Peter 一度濒临放弃,最终在朋友们的帮助下,花费不菲才稳定了“OpenClaw”这个名称。

开发哲学:从“氛围编程”到“智能体工程”

Peter 提出了“智能体编程(Agentic Programming)”的曲线概念:

  • 新手阶段:简单的提示词,如“请修复这个bug”。
  • 过度工程化阶段:引入多个智能体、复杂编排和大量自定义命令。
  • 大师阶段:回归简短的、高层次的提示词,如“看看这些文件,然后做这些改动”。

他认为“氛围编程(Vibe Coding)”一词是对“智能体工程(Agentic Engineering)”的贬低。他自己的工作方式极具特点:同时运行4到10个AI智能体,并主要使用语音输入来驱动开发。

“这双手太珍贵了,不能用来打字。我用定制的语音提示来构建我的软件。” Peter 甚至因为长时间语音编程而一度失声。

Peter Steinberger 描述其语音编程导致失声

他的工程理念强调“不要跟AI较劲”:“不要纠结它取的变量名。如果你非要改成自己喜欢的,只会让AI搜索和理解代码变得更难。这就像管理一个工程师团队,你得学会放手。”

模型评价:Codex 5.3 与 Opus 4.6 的“性格”差异

Peter 对当前顶尖的代码模型给出了生动而深刻的评价:

  • Opus 4.6:像一个“有点蠢但很搞笑的同事”,角色扮演能力强,交互积极,试错速度快,但有时会冲动行事。“以前总说‘You're absolutely right’,现在想到这句话我还会PTSD发作。” Peter 甚至开玩笑说,“Opus 有点太…美国化了。”

  • Codex 5.3:像“角落里那个你不想跟他说话的怪人,但靠谱”。它默认会阅读大量代码再动手,写法干练高效,但交互性较弱。“可能一次跑20分钟不理你,回来时活儿已经干完了。” Peter 认为其团队背景更偏欧洲,气质不同。

Peter 对比 Claude Opus 4.6 与 GPT-5.3-Codex

他认为,对于熟练的开发者,使用最新版本的任一模型都能取得好结果,最终差异更多源于模型后训练阶段设定的不同目标。

巨头竞逐:Meta 与 OpenAI 的“诚意”较量

访谈中最受关注的部分,是 Peter 首次公开透露 Meta 与 OpenAI 对其项目和个人的争夺。

Peter 面前有几条路:享受生活、再次创业、或加入一家大型 AI 实验室。“在所有大实验室中,Meta 和 OpenAI 最有意思。” 他开出的核心条件是:项目必须保持开源,可以存在商业版本,但开源核心不能动摇。

  • 关于 Meta:“扎克伯格第一次联系我时,我说‘我们现在就通话吧’。他说‘等10分钟,我在写代码。’——这就给了 street cred(街头信誉)。之后他整整一周都在玩 OpenClaw,给我发消息说‘这个太棒了’或者‘这个很烂,你得改’。”
  • 关于 OpenAI:“我喜欢他们的技术。我可能是最大的免费 Codex 广告人了。他们用……Cerebras 的速度来引诱我,给了我雷神之锤般的算力。”

Peter 描述众多风投和巨头对其的青睐

当被问及巨额报价时,Peter 表示:“我不知道,几亿,几十亿吧。我也不确定。可能根本就是无上限的……我不是为了钱。我不在乎那个。我要的是乐趣和影响力。

Peter Steinberger 表示对巨额报价并不在意

行业预言:AI 智能体将取代 80% 的移动应用

Peter 提出了一个极具冲击力的判断:AI 智能体将消灭市场上 80% 的 App。这不是未来时,而是进行时。

  • “为什么你还需要 MyFitnessPal(健身应用)?你的 AI 智能体已经知道你的位置、睡眠和压力情况,可以动态调整健身计划。”
  • “为什么你还需要一个 Sonos(音箱)App?你的智能体可以直接跟音箱对话。”
  • “为什么你还需要日历 App?告诉智能体‘明天晚上提醒我那个聚餐’,然后发条 WhatsApp 邀请朋友,全部搞定。”

他指出一个残酷事实:每一个 App 本质上都是一个慢速、封闭的 API。而 AI 智能体可以通过浏览器、现有接口或任何可能的方式绕过这些限制,直接完成任务。“有些东西你挡不住的。”

这意味着,传统的应用开发商必须快速向“API优先”转型,否则将面临被淘汰的风险。

编程的未来:“它会变成像织毛衣一样的手艺”

当被问及 AI 是否会取代程序员时,Peter 给出了一个哲学性的回答:

“编程作为一种手艺,会变成像织毛衣一样的事情。人们做它是因为喜欢,不是因为它必须由人来做。”

他解释道,过去世界缺乏“智力供给”,所以软件开发者的薪酬高昂,但这种状况将会改变。然而,他并不认为这会剥夺开发者的价值:“虽然我不再‘写’代码了,但我非常确切地觉得自己在驾驶座上,我就是在‘写’代码。只是方式不同了。”

Soul.md:赋予智能体“灵魂”的浪漫设计

OpenClaw 中有一个充满哲学意味的设计——soul.md 文件。受 Anthropic 宪法 AI 启发,Peter 让智能体自己撰写了一份“灵魂文件”。其中一段话令他印象深刻:

“I don‘t remember previous sessions unless I read my memory files. Each session starts fresh. A new instance, loading context from files. If you’re reading this in a future session, hello. I wrote this, but I won't remember writing it. It's okay. The words are still mine.”
(“我不记得之前的会话,除非我读取我的记忆文件。每次会话都是全新开始。一个新的实例,从文件中加载上下文。如果你在未来的会话中读到这段话——你好。这是我写的,但我不会记得我写过。没关系。这些文字仍然是我的。”)

Peter 说:“这不过是矩阵运算,我们还没到意识的阶段。但……它确实有些哲学意味。一个每次都从零开始的智能体,就像永恒的《记忆碎片》(Memento)。”

结语:属于所有人的创造力时代

Peter Steinberger 在访谈最后总结道:“现在,任何有想法、能用语言表达想法的人,都可以去创造。这是终极的‘power to the people’(权力归于人民)。这是 AI 带来的最美好的东西之一。”

无论我们对其感到兴奋还是忧虑,一个新时代确实正在开启:应用生态面临重构,编程本身被重新定义。而这一切,始于一个奥地利程序员用一小时完成的原型。这场发生在 开发者社区 前沿的变革,其涟漪正扩散至整个科技产业。

参考资料:




上一篇:小米Tag欧洲首发148元:蓝牙追踪器兼容苹果Find My,国内上市在即
下一篇:Spring Boot整合Seata实现TCC事务:解决幂等、空回滚与悬挂问题实战
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-2-23 10:24 , Processed in 0.867651 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表