如果你关注AI编程的前沿动态,那么Andrej Karpathy的名字你一定不会陌生。这位前特斯拉AI总监、OpenAI创始成员,不仅是“Vibe Coding”(氛围编码)理念的提出者,更曾以一句“最热门的新型编程语言是英语”引发广泛讨论。
今早,Karpathy在社交媒体上发布了一条推文,迅速成为技术圈的热点。他分享了自己购买新Mac mini并准备深入研究Claws的经历,同时表达了对AI技术栈演进的看法。他提到:“就像LLM智能体是建立在LLMs之上的新层次一样,Claws现在也是建立在LLM智能体之上的新层次,将编排、调度、上下文、工具调用和某种持久性提升到了新的水平。”
这段论述清晰地勾勒了AI技术发展的三个关键阶段。
AI技术的三层演进
Karpathy的观点指出,AI能力的构建是一个层层递进的过程:
-
第一阶段:LLM(大语言模型)
以ChatGPT、Claude为代表的对话模型是这一层的核心。它们如同一个超级大脑,能够理解和生成自然语言,进行对话、创作和基础推理。然而,其局限性在于“有脑无手”——它们只能停留在对话框中进行信息交互,缺乏与外部世界(文件、网络、API)直接行动的能力。
-
第二阶段:Agent(智能体)
这是在LLM基础上增加了“工具调用”能力的进化。以Claude Code、Cursor、以及国内的诸多AI编程助手为代表,智能体可以让大模型“长出手脚”,执行诸如编写文件、运行命令、操作浏览器等具体任务。其核心问题是“用完即走”,缺乏记忆和主动性,每次交互都是孤立的会话。
-
第三阶段:Claw
Karpathy此次讨论的重点。Claw在智能体的基础上,引入了四个维度的核心能力:
- 任务编排:能够管理复杂的多任务流程,理解任务间的依赖和先后顺序。
- 定时调度:具备自主安排工作计划的能力,能够定时、主动触发任务,而非被动响应用户指令。
- 上下文记忆:拥有持久的记忆能力,可以记住历史对话和工作内容,形成连贯的工作流。
- 持久化运行:以服务或常驻进程的形式7x24小时在线,成为一个“永远在线”的数字助手。
我们可以用一个形象的比喻来理解这三者的关系:
- LLM = 一个超级大脑,你问它答。
- Agent = 大脑长了手脚,能替你干活,但干完就走。
- Claw = 住在你电脑里的数字员工,有日程表、有记忆、能自己找活干,还会主动向你汇报。
蓬勃发展的Claw生态
随着高层理念的明晰,市场上涌现出一系列各具特色的Claw实现。Karpathy在推文中列举了包括NanoClaw、zeroclaw、ironclaw、picoclaw在内的多个项目。
其中,他特别提到了NanoClaw。其核心引擎大约只有4000行代码,兼顾了人类和AI的可读性与可审计性。它默认在容器中运行,确保了环境的一致性。更独特的是其配置哲学——它不依赖于传统的配置文件,而是通过“技能”进行扩展。例如,执行类似 /add-telegram 的命令,AI代理会主动学习如何修改代码以集成Telegram功能。这种方式避免了复杂的配置项和条件判断逻辑,代表了一种新颖的、为AI时代设计的工程范式。
此外,Karpathy也表达了对本地部署方案的偏爱。他认为,相比云托管方案,本地运行的Claw(例如在他的Mac mini上)可以更灵活地连接到局域网内的智能家居设备。他幽默地形容这种体验为:“一个被个人数字家养小精灵的幽灵‘附身’的物理设备,有一种美学上的吸引力。”
尽管Karpathy对OpenClaw这个具体的开源项目本身持谨慎态度(他称其为“40万行Vibe Coding代码的怪物”,并对其大规模部署下的安全问题表示担忧),但他对“Claw”这一品类的前景极为乐观,并总结道:“Claws是AI技术栈中一个令人惊叹、令人兴奋的新层次。”
从理论到实践:Claw的实际应用
对于许多深度AI使用者而言,从Agent到Claw的体验是一种质变。一位自称“骁哥”的实践者分享了他的切身体会,他完整经历了从使用ChatGPT“聊天编程”,到利用TRAE、Cursor等智能体辅助开发,再到部署OpenClaw的整个历程。
在他的实践中,部署的Claw已经承担了多项自动化工作:
- 主动热点追踪与选题推荐:Claw能够实时监控技术社区动态。例如,在Karpathy发布关于Claws的推文后,该Claw迅速识别出其热点潜力和与博主定位的契合度,主动发出提示,建议立即跟进撰写分析文章,抢占首发窗口。
- 数据自动复盘与分析:Claw每日定时拉取公众号后台数据,进行自动化分析,并总结出可操作的洞察。例如,它分析发现,分享率超过10%的文章更容易获得推荐算法的流量加持,而单纯的观点类文章则分享率较低。
- 网站自动化运营:通过集成各种技能,Claw可以自动化完成内容筛选、分类和入库工作。例如,它能从技术社区自动发现与AI技能相关的优质实践文章,并推荐给管理员进行收录,极大地提升了
www.skill-cn.com这类技能枢纽网站的内容更新效率。
- 自我进化与学习:Claw不仅执行任务,还能根据目标进行自我优化。例如,为了实现增长循环,它可以主动学习Programmatic SEO和Technical SEO的最新框架,并将这些知识转化为具体的网站架构优化策略,写入项目文档。
这些实践案例恰恰印证了Karpathy所总结的“编排、调度、上下文、持久化”四大特性。当Claw成为工作流中一个主动、持续、有记忆的参与者时,人机协作的模式便发生了根本性的改变。
小结与展望
从LLM到Agent,再到Claw,AI技术栈正以清晰的三层结构不断进化,每一层都是对上一层能力的质变式增强。Claw的出现,标志着AI正从被动的工具向主动的、具备一定自主性的数字协作者转变。
如同Karpathy去年提出“Vibe Coding”时曾面临的质疑一样,Claw这一新范式目前也处于早期阶段,在安全性、运维复杂度、资源消耗等方面确实存在挑战。然而,随着生态的快速发展和项目的持续迭代,其解决实际生产问题的潜力正在被越来越多的开发者和团队所验证。
对于开发者而言,理解这一演进路径,并积极探索像OpenClaw这样的实践,或许是在新一轮人工智能生产力浪潮中保持领先的关键。
参考资料
[1] Vibe Coding之父:OpenClaw是 AI 的第三阶段?, 微信公众号:mp.weixin.qq.com/s/Pugt6YwwruAxgpX7fw2Cqw
版权声明:本文由 云栈社区 整理发布,版权归原作者所有。