高德正式宣布全量开源其机器人具身操作基座模型 ABot-M0。这被认为是全球首个基于统一架构的模型,旨在实现一个“通用大脑”适配多种形态的具身机器人,为具身智能的工程化落地提供了重要的基础支撑。
根据官方信息,该模型在多个权威基准测试中表现优异。尤其是在 LibERO-Plus 基准上,ABot-M0 的任务成功率达到了 80.5%,相比此前的标杆方案 Pi0 提升了近 30%,实现了新的 SOTA(State-Of-The-Art)性能。

ABot-M0 模型架构图
此次开源并非仅仅释放模型权重,而是涵盖了数据、算法与模型三大维度,目标直指行业长期面临的数据孤岛与部署难题。
数据层面:开源了名为 UniACT 的通用机器人数据集。该数据集整合了超过 600 万条 真实操作轨迹,并提供了从原始异构数据到标准化训练数据的全流程处理管线。通过统一动作表示、坐标系与控制频率,使得来自全球不同厂商、不同型号的机器人数据能够被整合使用,从而大幅提升了模型预训练的效率。
算法层面:同步开源了模型架构与训练框架,其中包含两大关键技术:
- 动作流形学习(Action Manifold Learning, AML):该算法摒弃了传统基于噪声干扰的动作预测方式,转而让模型直接学习并预测物理上可行的动作序列。这种方法减少了模型在解码时的反复试错,显著提升了策略的稳定性和执行效率。
- 双流感知架构:该架构不仅利用了预训练的视觉语言大模型(如 Qwen 3-VL)来提供高级语义理解,还创新性地引入了一个“即插即用”的 3D 感知模块(例如 VGGT)。这个模块可以为模型注入几何先验知识,增强其对三维空间的理解和推理能力,且无需修改骨干网络结构,灵活性强。
模型层面:开源了端到端的预训练模型与完整的配套工具链。这意味着开发者无需从零开始搭建复杂的训练环境,即可快速将模型适配到工业、家庭服务等具体场景中。ABot-M0 的统一架构验证了“一个大脑驱动多种形态机器人”的技术可行性,为未来“通用大脑+专用躯体”的产业标准形成提供了实证基础。

ABot-M0 在 Libero-Plus 基准上的零样本性能评测结果(部分)
对于想要深入了解或使用的开发者和研究者,相关资源地址如下:
|