linuxx

5763 积分	0 好友	756 主题

发消息

[Python] 高德开源ABot-M0具身操作基座模型：全球首个统一架构适配多形态机器人

发表于 2026-4-15 03:45:22 | 查看: 134| 回复: 0

高德正式宣布全量开源其机器人具身操作基座模型 ABot-M0。这被认为是全球首个基于统一架构的模型，旨在实现一个“通用大脑”适配多种形态的具身机器人，为具身智能的工程化落地提供了重要的基础支撑。

根据官方信息，该模型在多个权威基准测试中表现优异。尤其是在 LibERO-Plus 基准上，ABot-M0 的任务成功率达到了 80.5%，相比此前的标杆方案 Pi0 提升了近 30%，实现了新的 SOTA（State-Of-The-Art）性能。

ABot-M0模型架构流程图

ABot-M0 模型架构图

此次开源并非仅仅释放模型权重，而是涵盖了数据、算法与模型三大维度，目标直指行业长期面临的数据孤岛与部署难题。

数据层面：开源了名为 UniACT 的通用机器人数据集。该数据集整合了超过 600 万条 真实操作轨迹，并提供了从原始异构数据到标准化训练数据的全流程处理管线。通过统一动作表示、坐标系与控制频率，使得来自全球不同厂商、不同型号的机器人数据能够被整合使用，从而大幅提升了模型预训练的效率。

算法层面：同步开源了模型架构与训练框架，其中包含两大关键技术：

动作流形学习（Action Manifold Learning, AML）：该算法摒弃了传统基于噪声干扰的动作预测方式，转而让模型直接学习并预测物理上可行的动作序列。这种方法减少了模型在解码时的反复试错，显著提升了策略的稳定性和执行效率。
双流感知架构：该架构不仅利用了预训练的视觉语言大模型（如 Qwen 3-VL）来提供高级语义理解，还创新性地引入了一个“即插即用”的 3D 感知模块（例如 VGGT）。这个模块可以为模型注入几何先验知识，增强其对三维空间的理解和推理能力，且无需修改骨干网络结构，灵活性强。

模型层面：开源了端到端的预训练模型与完整的配套工具链。这意味着开发者无需从零开始搭建复杂的训练环境，即可快速将模型适配到工业、家庭服务等具体场景中。ABot-M0 的统一架构验证了“一个大脑驱动多种形态机器人”的技术可行性，为未来“通用大脑+专用躯体”的产业标准形成提供了实证基础。

ABot-M0在Libero-Plus基准上的零样本性能对比表格

ABot-M0 在 Libero-Plus 基准上的零样本性能评测结果（部分）

对于想要深入了解或使用的开发者和研究者，相关资源地址如下：

项目开源地址：https://github.com/amap-cvlab/ABot-Manipulation
技术论文全文：https://arxiv.org/pdf/2602.11236

上一篇：Anthropic发布Claude Managed Agents，AI Agent平台化竞争升温
下一篇：OpenAI斥资数亿美元收购科技脱口秀TBPN：布局舆论场与构建AI公共空间

ABot-M0, 具身智能, 机器人, Qwen3VL, 动作流形学习

[Python] 高德开源ABot-M0具身操作基座模型：全球首个统一架构适配多形态机器人

相关帖子

浏览过的版块