当地时间2025年12月1日,英伟达通过其官网宣布开源其自动驾驶模型 Alpamayo-R1。同时,该模型对应的数据集也已上传至开源社区,总大小约100TB。这是英伟达首次将其视觉-语言-动作(VLA)大模型进行开源,并在数据许可中明确可将其用于商业和非商业用途。

Alpamayo-R1是全球首个针对自动驾驶场景设计的开源视觉-语言-动作大模型。与以往仅模仿驾驶动作的端到端模型不同,Alpamayo-R1的核心机制是“链式推理”——让车辆在做出决策时进行类似人类的逐步思考。其工作流程是:先将摄像头、雷达等传感器数据转化为自然语言描述,然后逐步进行场景分析和路径推理。
英伟达研究团队介绍,该模型可以像人类驾驶员一样分步思考:先识别路口处的动态参与者(如行人、车辆、自行车),推断其潜在意图,结合交通规则和历史轨迹预测其未来状态,再评估本车各种可行动作的安全边际,最终输出最优控制指令。
这种基于逻辑推理的“思考”过程,其核心目标是提升系统在复杂、罕见场景中的鲁棒性,这是衡量人工智能系统稳定性的关键指标。例如,当车辆在繁忙十字路口遇到杂乱施工路障、执行无保护左转或在雨夜中面对道路损毁等情况时,Alpamayo-R1能够通过推理预判风险并做出安全避让。

据公开的测试数据,Alpamayo-R1在针对极端长尾场景的评估中,相较于传统模型,规划准确率提升了12%,事故率降低了35%,近碰率降低了25%,同时实现了99毫秒的低延迟响应。
除了模型本身,英伟达此次开源的是一套“全栈方案”。这包括Alpamayo-R1模型、部分训练数据集、配套工具链、AlpaSim仿真评估框架以及来自“物理AI开放数据集”的部分训练数据。配套的Cosmos开发者工具链(Cosmos Cookbook)包含了高质量数据构建规范、合成场景生成流程以及模型评估基准等资源,方便开发者基于不同场景进行模型的微调与部署。
战略层面的考量
业内分析普遍认为,英伟达此举不仅是一次技术发布,更是一次深远的战略布局。
一方面,通过开放核心算法,英伟达旨在巩固并扩张其生态影响力。对于许多汽车厂商而言,过去需要投入巨大资源自行开发全套自动驾驶算法。而现在,借助英伟达的开源技术栈,它们可以更快速地构建系统:购买英伟达的芯片平台(如Orin/Thor),结合开源算法进行场景微调,便能实现高级自动驾驶功能。这被一些评论视为Robotaxi产业进入“安卓时刻”的标志。
此举也与英伟达的硬件销售目标相辅相成。更多开发者和整车厂采用其软件生态,自然会带动对车规级计算芯片的持续需求。
另一方面,英伟达明确表示,希望借助开源建立行业标准。让研发者深入理解模型的运作机制,有助于在行业内形成更统一的评测和安全标准。在全球日益强调自动驾驶安全与透明度的大环境下,开放模型有利于加速错误发现和修复,也能更好地迎合监管对系统可解释性的要求。
对产业链与中国市场的冲击与机遇
从产业链视角看,英伟达的开放动作加剧了开源与封闭阵营间的竞争。传统成熟的自动驾驶方案多为闭源体系,如特斯拉的Autopilot、Waymo等,其核心算法并不对外公开。
相比之下,英伟达此次将高阶推理模型全面开源,标志着高端自动驾驶技术的壁垒被进一步打破。这一变化可能会在行业内引发新一轮的开源热潮。“随着自动驾驶硬件趋于同质化,决策层面的算法和软件生态将成为关键竞争点。”一位业内人士指出。
对于中国车企和供应商而言,这场开源浪潮带来了明确的机遇与挑战。
机遇在于: 中国厂商对自动驾驶技术需求旺盛,且已有大量投资建立在英伟达平台上。据统计,在中国智能驾驶域控制芯片市场,除特斯拉自用芯片外,英伟达方案占据主导地位。对于这些依托英伟达平台的车企而言,开源软件和工具能够直接用于本地算法开发和场景调优,利用自身积累的大数据资源加速软件化转型。
挑战则在于: 要消化和应用像Alpamayo-R1这样复杂的大模型,需要大量掌握算法、软件及系统集成的复合型人才,而当前相关领域的人才缺口巨大。此外,中国车企和本土供应商需要评估自身是否具备足够的高精度地图、极端场景数据和高度仿真的测试环境,来反复验证与微调开源模型,确保其安全性和合规性,这涉及复杂的云原生仿真与持续集成流程。
总体而言,英伟达此次开源不仅演示了AI推理技术在车载场景的最新落地形态,更试图通过开放核心成果来定义下一代自动驾驶的开发范式。它为中国市场参与者提供了一条技术进步的“高速公路”,但能否安全、高效地驶入这条快车道,则取决于各自的技术储备、人才实力与生态整合能力。
Github:https://github.com/NVlabs/alpamayo
HuggingFace:https://huggingface.co/nvidia/Alpamayo-R1-10B