找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2286

积分

0

好友

308

主题
发表于 1 小时前 | 查看: 1| 回复: 0

上周,在北京猎豹移动的办公区举办了一场别开生面的“龙虾局”。猎豹董事长兼CEO傅盛坐着轮椅滑进会场,兴致盎然地分享着他的“养虾”心得。说到兴起处,他直接拿起手机,向自己的AI“龙虾”——代号“三万”——发了一条语音指令:

“让机器人穿过舞台,看到人就喊‘大家好,今天辛苦了’,间隔十秒,走到头停下。”

现场顿时有些骚动,观众们在期待中夹杂着一丝怀疑。片刻之后,场地中央的银色机器人真的启动了。它沿着预设的方向开始滑行,镜头缓缓扫过人群,停下,然后发出了问候。

猎豹移动活动现场

这并非事先编排好的脚本。傅盛在现场展示了完整的飞书对话记录,证实这确实是一个在前一晚才“搓”出来的Demo。全程没有彩排,甚至中途机器人还因为网络延迟“不听指挥”了一阵。但最终,它不但完成了任务,甚至还临场发挥,为自己编了几句不重复的广告词。

这究竟是怎么做到的?这场略显即兴的演示,实际上揭示了AI Agent能力边界的一次关键性延伸——从纯粹的软件世界,迈入了物理世界。

一、驱动机器人巡夜、互动、修Bug,EasyClaw如何做到?

上方那段不到两分钟的演示视频在社交媒体上获得了大量转发。其吸引人之处不仅在于“用AI操作机器人”这件事本身的酷炫,更在于它让许多人第一次直观地看到,智能体是如何在物理空间中自主学习、调用工具并处理异常的。

在正式进行公开演示之前,傅盛和技术团队决定先在自家办公室做一次“压力测试”。他们将猎豹移动的EasyClaw接入了公司的服务机器人。凌晨2点多,傅盛尝试让他的Agent控制办公区的机器人执行任务:每30分钟巡逻一次,拍照汇报,完成后自动返回充电。

AI龙虾“三万”与傅盛的巡检对话记录

由EasyClaw驱动的AI“三万”自主读取了机器人的开发文档,完成了API调用、路径规划和定时任务设置。初次尝试并非一帆风顺:机器人未能成功发送照片,还走错了位置。傅盛没有直接介入代码,而是将调试任务交给了“三万”。他询问:“你对大厅的定位是否有误?请发送当前地图数据。”“三万”立即调取了机器人的建图文件,识别出坐标偏差并自主完成了修正。第二次巡逻,路径准确无误,照片也成功发送到了傅盛的手机上。

将这个Demo搬到数百人聚集的发布会现场后,环境的复杂度急剧上升。人员走动、交谈和网络延迟都可能干扰机器人的视觉识别与指令响应。实际上,傅盛连续发出的多个“停止”指令就曾短暂失效,因为任务已从服务端下发,指令队列仍在执行中。机器人走完预设路径后,并未执行打招呼的核心动作。

机器人演示中途出现延迟,似乎在“思考”

傅盛随即向“三万”追问原因,并要求必须排查到代码层和文件层,以提高修改成功率。接到指令后,“三万”在现场开始写代码、写接口、跑测试,最终实时做出了“见到人触发喊话”这个功能。

机器人修正后返场并执行问候任务

二、不止于单次演示:如何自动化打造可复用Skill?

当机器人成功完成第一次穿越舞台的任务后,傅盛对“三万”提出了新要求:“我觉得演示完成,完全达到了效果。你把这个写成一个Skill呗,然后下次我们直接就可以调用了,不用再这样调试了。”

傅盛提出将Demo封装为Skill的聊天记录

在传统的机器人开发流程中,封装一个类似“巡逻喊话”的功能可能需要工程师数天时间进行开发、联调和优化。更棘手的是,这类功能往往难以复用,不同场景需要重新编码。

而“三万”在几分钟内就完成了封装。它自动识别了任务的核心逻辑与参数(如路径、触发条件、播报内容),将其打包成一个可配置、可调用的标准技能(Skill)。

效率的提升是立竿见影的。当同样的需求再次出现时,开发者无需重新规划、编码,只需调用这个Skill并修改几个参数即可。傅盛在后续演示中印证了这一点:第二次执行类似任务时,响应速度从分钟级缩短到了秒级。

Skill封装完成的提示界面

EasyClaw的潜力不止于此,它甚至能让机器人自主处理开放式任务。演示尾声,傅盛给出了一个更开放指令:“你现在穿越大厅,然后碰到人就来推广EasyClaw,你自己想些词,每个人不要讲超过5句话。”

借助已封装的Skill和大模型的内容生成能力,机器人开始移动。遇到第一位观众时,它说:“告诉您一个秘密,我刚才谈话、拍照、走路全是EasyClaw在指挥我,它就是这么神。牛不?”遇到下一个人,话术又变成了:“您的AI全能助手,不用写代码,说句话就让我跑腿,您还在等什么?”

事后“三万”汇报,它一共生成了5句不同的广告词,每次随机挑选,确保不重复。傅盛对此评价道:“比我想的好。你们一定要相信这个东西超越人的很多点,它不是简单替代,就是它比你做得好。”

三、当Agent住进机器人体内:猎豹移动的新想象

这次演示中担当重任的机器人,是猎豹移动旗下猎户星空自主研发的“豹小秘”。这款机器人早已在接待、讲解、导览等超过20个垂直场景中落地应用,曾亮相国庆70周年群众游行彩车,也是北京冬奥会期间唯一的语音交互机器人。

豹小秘机器人亮相国庆70周年彩车

丰富的场景落地经验,让猎豹对行业痛点有深刻理解。傅盛以餐厅为例指出,过去操作机器人高度依赖专业编程,工程师与服务员之间存在巨大的“技术鸿沟”。培训一名服务员熟练操作可能需要三个月,而人员一旦流动,所有培训投入便付诸东流。

“EasyClaw+机器人”的模式为这一困境提供了新的解题思路——如果机器人能“听懂人话”并自动执行,复杂的后台操作与冗长的培训周期将大幅缩短。其核心价值在于“技术平权”,将驱动机器人的能力,从少数工程师手中释放给了广大的终端用户。

事实上,猎豹在相关领域的布局早已开始。去年7月,猎户星空便发布了AgentOS,一个面向语音交互场景的机器人操作系统。该系统通过GUI结合自然语言交互与原生API,让用户能用自然语言直接定义和派遣任务。

猎户星空AgentOS架构图

至此,机器人从一个执行固定脚本的“自动化设备”,进化成了可被自然语言实时“编程”的智能体终端。而EasyClaw与机器人的深度结合,则为AI Agent提供了在物理世界的实体化身。

这种软硬一体的融合,正在加速扩展Agent的能力边界。未来,Agent不仅能在数字世界编写代码,也能像演示中那样在现实世界互动、宣传,甚至可以化身为小店的智能决策中心,根据实时观察到的情况,自主建议第二天的进货量。傅盛甚至设想,未来可用自然语言直接驱动机械臂,完成摄影等复杂轨迹任务。

结语:Agent+机器人,从炫酷Demo走向实用工具

必须承认,这次现场演示并非完美无缺。傅盛在现场也坦承,机器人的芯片算力、通信延迟等问题仍有优化空间。但它所展现的潜力和方向是清晰且激动人心的。

面对一台能听懂指令、自主调试、甚至能即兴发挥的机器人,傅盛的反问道出了许多人的心声:“这个东西哪个老板不要一个?”

据悉,猎豹移动已开启相关技术的快速迭代,现有 demo 中的原始感有望在短期内得到显著改善。另据消息,猎户星空将于3月27日举办合作伙伴共赢大会暨豹小秘系列新品发布会,届时可能会带来更成熟的解决方案。

猎户星空2026合作伙伴大会宣传海报

当AI Agent走出屏幕,真正“住进”机器人的身体,无数曾经只存在于想象中的应用场景正在变得触手可及。这次零彩排的演示,更像是一声发令枪,宣告了一个软硬结合、自然交互的智能体应用新时代,正加速从Demo走向我们的现实生活。对于这个充满可能的未来,我们可以在云栈社区保持关注并持续交流。




上一篇:中科可控推出OpenClaw“线程大师”工作站:AI智能体摆脱CPU瓶颈的关键
下一篇:万亿参数MoE大模型Yuan 3.0 Ultra:如何用LAEP等技术破解企业AI成本困局
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-19 06:25 , Processed in 0.475151 second(s), 42 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表