
英伟达CEO黄仁勋近期一句评价引发了大量关注,他称 OpenClaw 是“我们这个时代最重要的软件发布”。他甚至感叹,Linux花了三十年达到的普及度,OpenClaw只用了三周就超越了。
这个被网友戏称为“小龙虾”的开源项目,在GitHub上迅速斩获超过24.8万颗星,登顶星标榜。雷军下场点评“手机龙虾”,阿里云、腾讯云、火山引擎等国内云服务商更是争相接入,各大模型厂商也纷纷推出自己的适配版本。
但时间拉回几个月前,另一个同样旨在让AI“替人干活”的产品,却经历了截然相反的命运。
去年,搭载“豆包手机助手”的工程样机首销即被抢空,二手市场价一度被炒至五六千元。然而紧随其后的,是来自腾讯、阿里、美团等多家互联网大厂的集体封堵。部分银行和金融类App甚至直接弹窗,提示用户该助手存在安全隐患。
豆包手机助手,几乎被主流应用生态集体“封杀”了。
同样是AI自动化工具,为何一个遭遇围剿,另一个却被追捧?这巨大的反差不禁让人思考:如果豆包手机助手想要摆脱困境,它能从 OpenClaw 的成功中学到什么?
1、豆包手机错在哪?不是太强,是太独立
豆包手机助手的核心技术路线,依赖的是视觉识别。它模拟人眼“观看”手机屏幕,理解界面上的元素(如按钮),再模拟手指点击进行操作。
这条路径的优点显而易见——兼容性极强。它不需要目标App做任何适配,理论上“什么都能干”。但硬币的另一面是,其所需的系统权限也高得惊人。有技术测评显示,豆包手机助手曾申请超过100项系统权限,其中近四成属于高敏感权限,能够读取短信、获取精确定位,甚至静默安装应用。
更为关键的是,它利用的是系统底层的无障碍权限。这意味着,它能够截取到包括安全键盘在内的几乎所有屏幕内容。想象一下,当你在输入银行密码时,一个第三方助手能够“看到”并记录你的输入,这无疑触及了安全红线。
然而,真正令各大互联网公司感到不安的,或许并非纯粹的技术风险,而是其背后的生态野心。豆包手机助手是字节跳动旗下的产品,当用户通过它来操作淘宝、微信或其他App时,所有的交互行为、偏好数据乃至操作轨迹,都可能被字节所掌握。
对大厂而言,这无异于一把“万能钥匙”。这把钥匙不仅能打开所有App的“门”,还能将“门”内的数据资产搬走。淘宝花了十几年积累的用户行为模型,微信精心构建的社交关系链,都可能因为这个AI助手的“读屏”能力而被间接获取,而用户甚至无需打开原生App。
大厂并非抵触AI助手这个趋势,他们抵触的是“入口”被他人掌控。豆包手机助手试图成为用户与所有数字服务之间的唯一中介,这是任何一家有志于构建自身生态的平台都无法接受的。
2、OpenClaw赢在哪?不是更安全,是更开放
OpenClaw 选择了另一条完全不同的路径。
它本质上是一个开源框架,其核心设计理念强调“本地运行”。你可以将它部署在自己的个人电脑、服务器或私有云上,使用你自己的大模型API Key,调用你自己选择的模型。
从技术架构看,OpenClaw基于MCP(Model Context Protocol)协议构建,采用核心层(调用大模型)、适配层(连接通讯平台)和技能层(执行具体任务)的三层结构。它不依赖视觉识别,而是通过系统API或应用提供的标准接口来执行指令。
这意味着什么?
OpenClaw 没有“万能钥匙”。它需要使用者主动授权、自主配置。所有的操作指令和数据流转都发生在用户可控的环境内,而不是上传到某个中心化的云端服务器。数据主权,牢牢掌握在用户自己手中。
对于云服务商和应用厂商来说,这样的 OpenClaw 不仅不可怕,反而是一个“宝藏”。因为部署和运行OpenClaw需要消耗大量的计算资源(尤其是大模型推理)。有分析测算,一个配置得当、频繁使用的OpenClaw实例,其单日的Token消耗量可能是普通聊天机器人的几十甚至上百倍。
在过去一段时间,推理侧算力消耗增长乏力,云厂商的服务器库存面临压力。OpenClaw这种“Token粉碎机”式的应用,正好成为了消化算力库存、推动云服务增长的完美催化剂。
因此我们看到,腾讯云、阿里云、火山引擎等厂商,不仅没有封杀OpenClaw,反而争相提供一键部署、优化接入等服务,甚至摆摊“免费安装”。用开源社区的项目,带动自家云计算资源和模型API的消耗,这是一笔再划算不过的生意。(延伸阅读:硅谷在封,中国在抢:OpenClaw到底改变了什么?)
3、豆包手机能学OpenClaw吗?
如果豆包手机助手希望避免重蹈覆辙,它确实可以从OpenClaw的模式中汲取一些关键思路。
第一,从“黑箱”走向“透明”
OpenClaw让各方放心的首要原因是其开源属性。代码公开可审计,运行逻辑清晰可见,没有隐藏的后门。豆包手机助手若能将其核心框架部分开源,或至少向合作伙伴提供详尽的技术白皮书与审计接口,甚至推出支持本地化部署的企业版方案,将有助于大幅降低合作伙伴的信任成本。
第二,从“取代”转向“配合”
OpenClaw从不试图成为那个“唯一的中介”,它只提供工具,把选择权交给用户。豆包手机助手能否将自身定位,从“替代其他App”调整为“增强其他App”?例如,主动开放API接口,允许淘宝、微信等应用将自己的服务能力以标准化方式接入豆包助手;或者,让用户可以选择使用哪个服务提供商的后端来完成订餐、打车等操作。
第三,从“数据掠夺者”变为“算力消费者”
OpenClaw被云厂商追捧的根源,在于它创造了巨大的算力需求。豆包手机助手或许可以考虑调整其商业模式,从依靠硬件销售和数据价值,转向成为一家 AI 能力 服务商。例如,推出面向企业的B版服务,企业按调用的Token量或处理的任务量为豆包助手的AI能力付费。这样,豆包就从争夺数据的“竞争者”,变成了帮助云厂商和模型商赚钱的“合作伙伴”。
4、两条路,还是第三条路?
将上述三点建议合并起来看,其实指向了一个更根本的行业性问题:豆包手机助手与OpenClaw的对比,恰好折射出当前AI助手发展的两条主要路径。
一条是 “闭环生态” 之路。豆包手机助手代表了这种思路:用自己的硬件、自己的模型、自己掌控的系统级权限,打造一个体验无缝、一步到位的终极AI助手。这条路用户体验可能最流畅、门槛最低,但代价是必须直面整个行业既得利益者的集体对抗。
另一条是 “开源框架” 之路。OpenClaw是这一路径的典范:不掌控入口,不占有数据,只提供一套开放的工具和协议,让用户自由选择模型、部署环境和服务提供商。这条路初期门槛较高,体验可能更碎片化,但却能最大限度地凝聚生态力量,获得广泛支持。
那么,豆包手机助手能否在两者之间,找到一条“第三条路”?
比如,将其核心框架开源以建立信任,同时提供托管的云端服务供普通用户便捷使用;并设计开放的插件与API体系,允许各领域服务商深度集成。这样,它或许能在保留一定体验优势的同时,赢得生态的接纳。
当然,这只是一个理论上的构想。能否落地,最终取决于字节跳动高层的战略抉择。但至少,OpenClaw的火爆已经揭示了一个清晰的趋势:在AI助手的竞技场上,封闭对抗开放的第一回合,似乎已见分晓。
5、更大的命题:AI时代需要超级入口吗?
豆包手机与OpenClaw的遭遇战,背后其实是一个更具时代性的问题:AI时代,究竟需要什么样的产品形态?
回顾过去二十年,互联网的发展史几乎就是一部“超级平台”的成长史。微信、淘宝、抖音……这些超级App的共同特点是试图将用户的时间、注意力、社交关系与消费行为全部“圈”在自己的围墙花园之内。平台即生态,入口即霸权。
豆包手机助手的逻辑略有不同,但本质相似。它不想圈住你,而是想成为你通往所有其他服务的“唯一收费站”。你不需要打开一个个App,所有事情都通过“我”来办。这依然是一种对“控制点”的争夺。
而OpenClaw代表的则是另一种范式。它既不是花园,也不是收费站,它更像用户手中的一把“瑞士军刀”或一套“乐高积木”。数据归你,模型任选,部署在哪儿由你决定。它提供的是能力,而非控制。
这或许预示着,未来的用户可能不再需要一个统一的、中心化的AI超级入口来调度一切。用户需要的,可能是一个开放的、可本地化部署的、用户自主控制的 “AI能力层” ,就像互联网赖以运行的HTTP协议一样。
想象一下,如果当年有公司声称“所有网站都必须通过我的服务器访问”,还会有今天的互联网吗?AI时代或许同理,很难再出现一个所有人和所有服务都必须经过的“AI微信”。更可能出现的,是一个类似“AI时代的HTTP”的开放协议层。
OpenClaw,或许正是这个未来协议的一个早期雏形。
6、启示:围墙正在倒塌
回到最初的问题:为何豆包手机助手被封杀,而OpenClaw却火了?
答案逐渐清晰:
- 身份差异:一个想当掌控流量的“收费站”,一个甘做用户手中的“工具”。
- 信任基础:一个是闭源的商业黑盒,一个是代码可见的开源项目。
- 生态关系:一个意图成为中介与中心,一个只提供能力与连接。
这三重差异叠加,注定了两者截然不同的命运。豆包手机助手的困境,不仅仅是一个产品的挫折,更可能标志着一个时代的转折:试图构建封闭“超级入口”的时代,或许正在走向终结。
互联网上半场的故事,是巨头筑墙、圈地、争夺用户时长。AI时代的下半场,故事的开篇似乎正在转向拆墙、开源、将选择权与控制权逐步交还给用户。
这不是因为哪家公司技术不够强,而是因为技术演进的浪潮,或许已不再需要那个传统的、中心化的“超级入口”了。
围墙正在松动,而这次,锤子可能握在了更注重自主与开放的用户,以及拥抱开源协作的开发者手中。对于关注技术趋势与生态发展的朋友,欢迎来 云栈社区 分享你的观察与见解。