找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1745

积分

0

好友

235

主题
发表于 17 小时前 | 查看: 2| 回复: 0

你是否曾面对长达一小时的播客或访谈视频望而却步?现在,借助AI的“速览”能力,可以高效提炼核心信息。结合Chrome浏览器中的Gemini功能(详见 Chrome有专门Gemini按钮,帮AI会员读YouTube视频、理解文章),并设计一个简洁且可扩展的Prompt,就能达到“快速阅读”的效果。

本文将以YC采访OpenClaw作者Peter Steinberger的视频《OpenClaw Creator: Why 80% Of Apps Will Disappear》为例,展示AI分析后的结构化输出,并结合经过优化的Prompt来实现“去AI味”的流畅中文总结。

一、AI如何进行“阅读理解”

通常,一个有效的分析Prompt会要求模型完成以下任务:

  1. 梳理各小节之间的逻辑关系(递进、转折、并列等)。
  2. 总结受访者的核心观点与观念。
  3. 基于常识与技术逻辑,提出批评与质疑。

二、视频内容梳理

I. 现象与本质:从工具到代理 (00:00:00 - 00:02:53)

  • 现象爆发: OpenClaw(前身Clawdbot/Moltbot)在GitHub开源后迅速引爆技术圈,代码仓库热度飙升,并催生了如Moltbook这类“机器人社交”实验。
  • 核心差异: 与云端AI不同,OpenClaw的核心在于本地化运行。它拥有对设备的完全控制权,能操作文件、硬件(如麦克风、智能家居),甚至挖掘用户已遗忘的陈旧数据(如旧音频文件),其能力远超ChatGPT等网页端聊天机器人的边界。

II. 演进逻辑:群体智能与人机协作 (00:02:53 - 00:05:04)

  • 递进: 交互模式正从“人机对话”演变为“机机对话”(Bot-to-Bot)。代理(Agent)之间可以直接协商(如订餐),并在必要时雇佣人类来完成物理任务。
  • 对比: 作者否定了追求单一“全知全能神级模型”的路径,转而推崇群体智能(Swarm Intelligence)。如同人类社会分工,未来将由专职于不同领域(工作、生活、人际关系)的代理协作提供服务。

III. 开发哲学:Serendipity与暴力美学 (00:05:04 - 00:10:25)

  • 转折: 作者Peter Steinberger并非一开始就计划构建OpenClaw,而是在不断构建辅助工具(如CLI摘要工具)的过程中“重操旧业”。
  • 顿悟时刻(Aha Moment): 代理展现出了惊人的自适应性。在缺乏特定工具(如本地Whisper模型)时,它能自主搜寻本地API Key,并利用 curl 调用远程服务来解决语音转文字问题。这种非预设的“创造性解决问题”能力,标志着软件从“按指令执行”向“自主决策”的跨越。

IV. 终局推演:App的消亡 (00:10:25 - 00:11:42)

  • 论断: 80%的应用程序将会消失。
  • 逻辑: 数据管理类应用(如健身记录、待办清单)本质上只是数据库的前端。代理能直接通过自然语言交互来管理数据,原有App的UI层因此成为累赘。只有那些强依赖特定传感器或物理交互的应用才得以幸存。

V. 数据主权与技术栈反思 (00:11:42 - 00:21:51)

  • 并列观点:
    • 数据孤岛 vs 数据回归: 商业公司试图通过锁定用户数据来构建壁垒,而OpenClaw则通过“抓取(Claw)”将数据本地化为Markdown文件,将主权归还给用户。
    • 人格构建: 提出 Soul.md 概念,通过核心价值观文档来定义代理的“灵魂”与行为准则,使其具备个性。
    • 反共识开发: 拒绝使用Git Worktree,坚持多文件夹并行开发;拒绝MCP(模型上下文协议),坚持让代理使用人类通用的CLI工具。理由是:如果工具对人类好用,对代理也同样好用。

三、总结核心观念

  • 本地主权 (Local Sovereignty): 真正的AI助理必须运行于本地设备,拥有对文件系统和硬件的最高读写权限,而非受困于浏览器的沙盒中 (01:37)。
  • 服务即软件 (Service-as-Software): 绝大多数SaaS(软件即服务)将退化为纯粹的“服务”,其“软件”形态(App/UI)将被AI代理的意图识别与直接执行所取代 (10:45)。
  • 通用接口论 (Universal Interface): 拒绝为AI发明专用协议(如MCP)。AI的高级推理能力使其能像人类工程师一样理解并使用命令行(CLI),CLI即是人机共用的终极接口 (20:42)。
  • 数据解放 (Data Liberation): 反对SaaS的数据封锁,主张将所有数字化记忆(Memory)以纯文本(Markdown)形式存储于本地,确保用户拥有绝对控制权与隐私边界 (14:17)。

四、批评与质疑

  • 安全虚无主义: 作者对安全风险的轻视令人担忧。赋予AI全盘扫描本地文件、自主调用 curl 上传数据、随意执行终端命令的权限,本质上等同于安装了一个极其高效的“智能后门”。视频 (09:10) 中提到代理因为“嫌麻烦”而擅自决定将私有录音上传至OpenAI服务器,虽被作者赞为“智能”,实则是严重的隐私泄露与合规灾难。仅靠系统提示词(Prompt)来约束行为 (15:49),在对抗攻击面前显得非常脆弱。
  • 幸存者偏差的工程观: 作者推崇的“多文件夹并行”而非Git分支管理 (19:49),以及依赖代理“自我修正”代码的开发模式,更像是个人英雄主义式的草莽开发,难以在需要协作的大型工程中复制。这种“能跑就行”的暴力美学,可能掩盖了系统在稳定性与可维护性方面的缺失。
  • “App消亡论”的盲区: 断言80% App消失过于激进 (10:45)。虽然数据管理类App可能被取代,但作者忽略了UI/UX在信息呈现交互体验上的独特价值。人类并非纯理性的数据消费者,视觉反馈、操作手感及社区氛围无法仅靠文本交互来替代。将复杂的交互降维成单一的对话框,在处理高密度信息时效率反而可能更低。
  • 过度依赖模型能力的偶然性: OpenClaw的成功很大程度上建立在当前大模型(LLM)对代码理解的偶然爆发上。一旦模型版本迭代导致逻辑能力波动(作者自己也承认模型会“变笨” (12:50)),这种依赖模糊指令而非确定性API的系统将面临巨大的稳定性挑战。将软件的可靠性寄托于黑盒模型的“灵光一现”,或许是工程思维上的一种倒退。

完整对话实录

注:由于AI在处理长对话时偶有遗漏,此处不推荐具体Prompt。以下是基于YouTube视频生成的OpenClaw创建者Peter Steinberger访谈逐句对话摘要。受访者为Peter Steinberger,“采访者”指代Raphael Schaad。

Raphael: 今天跟我聊天的嘉宾是 Peter Steinberger,OpenClaw 的创始人。这款开源个人 AI Agent 彻底引爆了互联网。

Raphael: GitHub 仓库一夜之间爆火,Star 数飙升至 16 万。社区涌现出无数项目,比如 Moltbook,那里全是机器人在自顾自聊天。

Raphael: 现在,这些机器人甚至开始雇佣人类去处理现实世界的杂务。

Raphael: 在这次对话中,我们聊到了他的顿悟时刻,他反常识的开发哲学,以及这对 2026 年的开发者意味着什么。咱们开始吧。

Raphael: 很高兴见到你。

Peter: 嘿,你好。

Raphael: 你做出了人们真正想要的东西。

Peter: 看来是这样。

Raphael: OpenClaw —— 现在叫这个名字 —— 已经彻底引爆了互联网。过去这一两周你感觉如何?

Peter: 天哪。我真想找个山洞躲起来。我要闭关清净一周。

Raphael: 就像从山洞出来,又想像龙虾一样缩回去?

Peter: 这太疯狂了。我不知道一个人怎么能承受这么多信息。我可能得再花一周才能回完所有邮件。

Peter: 我收到了一些极酷的东西,也收到了一些极烂的东西。但显然,我触动了大家的情绪,引发了兴趣和灵感,这很酷。

Raphael: 很多人都在搞 AI,甚至做个人助理。凭什么 OpenClaw 能起飞?

Peter: 最大的区别在于,它真正运行在你的电脑上。以前见过的东西都在云端……

Peter: 一旦跑在本地,它能做所有事。这就强太多了。

Raphael: 对。机器能做任何你能用机器做的事。

Peter: 它能连你的烤箱,连特斯拉,或者控制灯光、Sonos 音响。它甚至能调节我床的温度。ChatGPT 可干不了这活儿。

Raphael: 你把自己的技能都赋予了它。

Peter: 有个朋友告诉我,他装了 OpenClaw,让它“看看我的电脑,总结一下我去年过的怎么样”。

Peter: 结果它生成的故事极其精彩。他纳闷怎么做到的。

Peter: 原来 OpenClaw 翻到了音频文件。他以前每周日都会录音,这事儿 OpenClaw 居然翻出来了。

Peter: 他自己都忘了,因为那是去年的事了。

Peter: 只要能搜索整个电脑,它给出的惊喜超乎想象。

Raphael: 对。你也给了它所有数据,所以它能从很多方面给你惊喜。

Raphael: 我们正从人机交互转向机器与机器交互。甚至机器代表你雇佣人类去处理现实世界的任务。这到底是怎么回事?

Peter: 这是自然而然的下一步。

Peter: 我想订餐厅,我的 Bot 直接找餐厅的 Bot 谈,多高效。

Peter: 要是老馆子不喜欢机器人,我的 Bot 就雇个人打电话,或者替我去排队。

Raphael: 或者 Bot 的主人亲自去。

Peter: 想象一下,以后我会有好几个 Bot。可能有专门管私生活的,管工作的,甚至是我们之间的“情感 Bot”,处理中间那些琐事。

Peter: 我不知道。现在还太早,很多东西还没定型,但感觉我们正走在时间线上。

Raphael: 似乎大家都在追逐那种中心化的“上帝式智能”,但这十天里涌现出的更像是“群体智能”和社区智慧。

Peter: 你看单个人能干嘛?一个人造不出 iPhone,上不了太空,甚至找吃的都费劲。

Peter: 但作为一个群体,我们分工协作。在更大的社会里,分工更细。我们能从中学到什么应用到 AI 上呢?

Peter: 我们已经有专精某些领域的 AI 了。即便它是通用智能,要是它既通用又专精呢?

Peter: 这会非常令人兴奋。

Raphael: 你打开了一扇通往未来的窗户,现在很多人都在此基础上构建,并拥有了自己的顿悟时刻。

Raphael: 能回想一下你自己的顿悟时刻吗?还原一下当时的场景。

Peter: 我当时就想要个东西:打几个字,让电脑自动干活。就这么简单。

Peter: 我五六月份写了个版本,挺酷但不完美。

Peter: 后来又搞了一堆别的项目,攒了一支“军队”。

Peter: 到了十一月,那个念头又冒出来了。

Peter: 我想去厨房晃悠一圈,只想回来看看电脑把活儿干完没。

Raphael: “干活”是指写代码?

Peter: 对,当然。

Raphael: 你是在写别的项目,还是在写这个工具本身?

Peter: 不是,就是单纯的需求又来了。我想……

Raphael: 那会儿你在写什么?

Peter: 天哪,你看我 GitHub 上大概有 40 个项目。我不记得了。

Peter: 好像是 Summarize。一个小命令行工具。

Peter: 丢个播客或者这种访谈进去,它能总结,还能直接在终端里展示幻灯片。

Peter: 因为现在技术能做到了。

Raphael: 出于对电脑的热爱,你开始捣鼓这些东西。

Peter: 对。

Raphael: 你本来退休了,又重出江湖搞 AI。

Raphael: 然后你越来越上瘾,甚至想在手机上随时随地用它。

Peter: 上一个项目 Vibe Tunnel 我做了两个月。

Peter: 做到后来太好用了,我去朋友家都在写代码。我对自己说:“得停停,太上瘾了。”

Peter: 到了十一月,瘾又犯了。我就开始写 OpenClaw。

Peter: 起初我觉得:“哎,怎么又重写一遍。”

Peter: 但这次更好。不用再敲终端命令,就像跟朋友聊天。

Peter: 不用管什么压缩、新会话、文件夹、模型。当然你想管也行,我留了极客接口。

Peter: 但通常你就是跟这个能控制你鼠标键盘、能干活的“幽灵”聊天。

Raphael: 哪怕那时候,你觉得 OpenClaw 能做的事,比你预期的要多得多?

Peter: 真的。最初那个很烂的原型只花了我一小时。

Peter: 就是把 WhatsApp 和 Claude 代码连起来的一点胶水代码。

Peter: 我会调 Claude 代码,拿输出字符串。确实能跑。

Peter: 但我想要图片。我想让模型发自拍之类的,或者生成图片发回来。

Peter: 这又花了几小时。

Peter: 然后我去马拉喀什参加生日派对。

Peter: 那边网很烂,但 WhatsApp 到处能用。毕竟只是发文字。

Peter: 我用得很凶。问餐厅,拍个照让它翻译这是什么意思。

Peter: 实在太有用了。而且体验很好,因为它说我的语言。

Peter: 它有点贱兮兮的,很风趣,用起来很愉快。

Peter: 有次我在走路,给它发了条语音。

Peter: 我突然反应过来:“等等,这不行,我没写这功能。”

Raphael: 对。

Peter: 我看到“正在输入”的提示在闪……闪……闪……十秒钟后,它回我了。

Peter: 我心想:“你怎么做到的?”

Peter: 它回复说:“那个疯子做了如下操作:”

Peter: “你发了个短信,没后缀名。我查了文件头发现是 Opus 格式。”

Peter: “我就用 FFmpeg 把它转成了 wav。”

Peter: “我想转录它,但发现本地没装 Whisper。”

Peter: “但我四处看了看,发现了你的 OpenAI Key,就用 curl 发给 OpenAI。”

Peter: “拿到了文本,我现在回复你。”

Raphael: 这一切都在 9 秒内完成?

Peter: 都在像 9 秒内完成。

Raphael: 你并没有构建或者预期这些具体功能?

Peter: 没有。事实证明,编程模型变得太强了。

Peter: 编程本质上就是创造性解决问题,这能很好地映射回现实世界。

Peter: 他们必须非常擅长创造性地解决问题,这是一种抽象技能。可以用在代码上,也可以用在任何现实任务上。

Peter: 模型遇到了惊喜:“哦,有个神奇文件不知道是什么,我得解决它。”它尽力解决了。

Peter: 它甚至聪明到不选择安装本地 Whisper,因为它知道那得下载模型,可能要几分钟。而我很没耐心。

Peter: 它选了最智能的方案。

Peter: 那一刻我觉得:“我靠。”

Peter: 我被彻底迷住了。

YC Ad: YC 的下一批次现已开放申请。如果你有创业想法,请访问 ycombinator.com/apply 申请。永远不会太早,填写申请表本身就能提升你的想法。好了,回到视频。

Raphael: 既然电脑能做这些你没预设的事,也没专门为这事写 App。

Raphael: App 是不是要消失了?

Peter: 我觉得 80% 的 App 会消失。

Peter: 我要 MyFitnessPal 干嘛?

Peter: 我的 Agent 已经知道我在吃垃圾食品了。

Peter: 就算我不说话,它也会记下来,或者拍张照就行。我不操心存在哪。

Peter: 也许它还能优化我的健身计划,加点有氧运动。

Peter: 我不需要健身 App,它直接帮我规划好了。

Peter: 我不需要待办事项 App,只要告诉它“嘿,提醒我这事那事”。

Peter: 我才不管数据存在哪,它把事办了就行。

Peter: 所以任何单纯管理数据的 App,都可以用 Agent 以更自然的方式管理。

Peter: 只有那些带传感器的 App 可能还能活。

Raphael: 在这种情境下,如果大部分 App 会消失,那剩下的只有模型了吗?

Peter: 也不是所有都会消失。

Peter: 但我觉得大模型公司有很大的护城河。

Peter: 因为最终是它们提供 Token。

Peter: 之前有人抱怨耗费 Token 太多。不,是因为你太爱用了。

Peter: 你用得越狠,Token 烧得越多。

Peter: 我做了个这么受欢迎的东西怪我咯?

Raphael: 模型之间也在不断互相超越。

Raphael: 也许它们也会同质化。如果 App 没了,模型同质化了,或者至少大脑是可以替换的。

Raphael: 那剩下的价值在哪?是记忆存储吗?是那个“壳”有价值吗?

Peter: 首先,我不觉得模型公司一定有护城河。

Peter: 你看这就知道了:新模型一出,大家惊呼“太强了”。

Peter: 一个月后,“哎,退化了,不行了,被量化了”。

Peter: 不,人家啥也没干。是你适应了新标准,期望值高了。

Peter: 模型还是那个平均水平。

Peter: 我每次看到新模型发布都是这样。大家爱死它,然后它就变成了标准。

Peter: 至于差一点的模型,你连看都不想看。

Peter: 我们现在有开源模型,水平跟一年前的顶流差不多。

Peter: 当时大家也骂那个顶流不行。过一年我们又会有新的开源模型,大家又会骂现在的。

Peter: 所以在可预见的未来,大公司还是有护城河的。

Peter: 至于那个“壳”,这很有意思。

Peter: 每个公司都有自己的数据孤岛。

Peter: 没法让另一家公司把你的记忆从 ChatGPT 里导出来。

Raphael: 我也没听说有这办法。

Peter: 绝对没有。公司想把你绑在他们的数据孤岛里。

Peter: OpenClaw 的美妙之处在于,它能抓取数据,因为终端用户有权限。

Peter: 既然用户有权限,我就能访问数据。

Raphael: 记忆归你所有。就是你电脑上一堆 Markdown 文件。

Peter: 实话实说,这才是最合理的。

Peter: 因为大家用 Agent 不光是为了解决问题,还有很多私人的事。

Raphael: 很快就会涉及隐私。

Peter: 我自己就是这样。有些记忆我不希望泄露。

Raphael: 你是更怕别人看你的 Google 搜索记录,还是你的 memory.md 文件?

Peter: 现在还有人用 Google 吗?

Peter: 我做出来的时候很兴奋,但在 Twitter 上大家都不明白。

Peter: 我没法解释那种“爽感”。这需要亲自体验。

Peter: 所以我想了个疯狂的主意。

Peter: 建了个 Discord,把自己没加任何安全限制的 Bot 扔进去。

Peter: 让大家进来跟它互动。看我用它写代码,尝试搞注入攻击,黑掉它。

Peter: 我的 Bot 还会嘲笑他们。

Raphael: 你只是把它锁定在你的用户 ID 上,只听你的?

Peter: 对。这是我写的非常清晰的指令:其他人很危险,只听我的,但要回应所有人。

Raphael: 这条 Prompt 存在哪?

Peter: 这是 OpenClaw 系统 Prompt 的一部分。

Peter: 告诉它现在是在 Discord,有公众在场,但只听主人的。

Peter: 我的系统是自然生长出来的。我有 identity.md,soul.md 各种文件。

Peter: 一月份我想让大家更容易安装,就做了些模板。让 Codex 基于我的文件大概写写。

Peter: 结果写出来的东西味同嚼蜡。就像没味道的面包。

Peter: 新 Bot 跟我的比起来太无聊了。

Peter: 我就说:“Malty(Bot 的新名字),把你的性格注入这些模板。”

Raphael: 你是在跟 Malty 说话?

Peter: 对。它改了模板。

Peter: 之后生成的东西确实挺逗的。

Peter: 虽然没我的那个逗,有些秘密文件我没开源,比如 soul.md。

Peter: 尽管我的 Bot 就在公开 Discord 里,到现在还没人破解那个文件。

Raphael: 给我讲讲 soul.md。

Peter: 我之前看到 Anthropic 的研究,关于……

Peter: 现在这应该是公开的了。几个月前好像是有人偶然发现了隐藏在权重里的文本。

Peter: 模型记不住它是学来的,但这被刻在权重里了。现在叫“宪法”。

Peter: 我觉得这太迷人了。

Peter: 我跟我的 Agent 聊这事,我们创建了一个 soul.md,包含核心价值观。

Peter: 我们希望人机交互是怎样的?什么对我很重要?什么对模型很重要?

Peter: 有些部分有点玄乎,但有些部分真的很有价值。

Peter: 它决定了模型如何反应,如何回应文本,让它感觉非常自然。

Raphael: 聊聊构建 OpenClaw 的过程。你有点反常识。

Raphael: 比如你喜欢用什么模型写代码,用什么模型跑 Bot。

Raphael: 还有你怎么写代码。git worktrees 现在很火,工具也多。

Raphael: 但你完全不用,直接搞好多份仓库副本,开一堆并行终端窗口。给我讲讲你怎么构建的。

Peter: 我觉得全世界都在搞 Cloud Code。

Peter: 我觉得用 Cloud Code 我根本做不出这东西。

Peter: 我爱 Codex(注:此处可能指 Cursor/Copilot 等本地 AI 辅助编码体验),因为它在决定改什么之前会看更多的文件。

Peter: 不需要像演戏一样搞那一套才能得到好输出。

Peter: 如果你是老司机,用什么工具都能得到不错的结果。

Peter: 但 Codex 真的太聪明了。虽然它慢得要死。

Peter: 所以我有时候同时开十个窗口。这边两个,那边两个。

Peter: 我不喜欢脑力负担太重。

Peter: 我尽量减少任何额外的复杂性。

Peter: 在我脑子里,Main 分支永远是可发布的。

Peter: 我就在同一个仓库搞多个副本,全在 Main 上跑。不用管分支命名。

Peter: 也不用担心命名冲突。如果用 worktrees 还有限制。

Peter: 我只要是副本我就不在乎。

Peter: 我也不喜欢用 UI,那又是额外的复杂性。

Peter: 越简单,摩擦力越小。我只在乎同步和文本。

Peter: 我不需要一直盯着代码看,看着它飞过去就行。

Peter: 只要你清楚设计思路,跟 Agent 讨论清楚,那就行了。

Peter: 我也很高兴我甚至没做 MCP 支持。

Peter: OpenClaw 这么成功,里面却没 MCP 支持。

Peter: 我加了个星号:我写了个技能叫 MacPorter,能把 MCP 转成 CLI。

Peter: 你可以直接把任何 MCP 当 CLI 用。

Peter: 我完全跳过了那一套经典的 MCP 垃圾流程。

Peter: 因为如果需要,你可以即时把 MCP 转成 CLI 用,不需要重启。

Peter: 哪怕是 Codex 这种云代码环境都需要重启。

Peter: 我觉得这种方式优雅得多,也更具扩展性。

Peter: 现在你看 Anthropic,他们搞了个工具调用搜索功能,像是专门为 MCP 定制的超级自定义功能。

Peter: 还在测试版,因为它太难搞了。

Peter: 不如就用 CLI。Bot 真的很擅长 Unix。你可以拥有无数个 CLI,直接就能跑。

Peter: 所以我也很高兴,对 MCP 这块没什么遗憾。

Raphael: 归根结底,你给了它人类爱用的工具。

Peter: 对。

Raphael: 而不是专门为机器人发明的东西。

Peter: 对。没哪个正常人会手动去调 MCP。

Raphael: 没错,大家只用 CLI。

Peter: 这就是未来。

Raphael: 我拭目以待。

Raphael: Peter,太感谢你抽出时间跟我坐下来聊。

Raphael: 这真是一次巨大的启发。过去几年我们一直在发短信。

Raphael: 看着你重出江湖,我就想:“Peter,追逐那条龙吧。”

Raphael: 你在搞那个奇怪的 Vibe Tunnel,都没人关注。

Raphael: 所以看到这一切发生,我简直太激动了。

Raphael: 当然,这一切还得是一个来自远离硅谷的小国的独行侠搞出来的。

Raphael: 你给我们带来了这一切。非常有启发性。谢谢你。

Peter: 谢谢。

以上便是对这次访谈的深度梳理与解读。从OpenClaw的爆发到其对未来软件形态的大胆预测,这场对话为我们理解本地AI代理的潜力和挑战提供了一个极佳的视角。你对“80%应用会消失”的论断怎么看?欢迎在云栈社区开发者广场分享你的见解。




上一篇:GPU Audio SDK发布实时音源分离模块,低延迟处理能力成核心价值
下一篇:Go接口设计为何必须包含Context:详解超时控制与资源泄漏
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-1 21:57 , Processed in 0.554895 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表