云栈社区»论坛 › 开发者广场「Dev Plaza」 › 李飞飞最新观点：世界模型是AI理解物理现实的关键 ...

发回帖发新帖

3910 积分	0 好友	512 主题

发消息

李飞飞最新观点：世界模型是AI理解物理现实的关键

发表于 2026-2-8 08:14:29 | 查看: 221| 回复: 0

李飞飞，这位与“人工智能教父”杰弗里·辛顿齐名的斯坦福大学教授，因其在视觉智能领域的开创性工作而被誉为“人工智能教母”。在大型语言模型（LLM）成为焦点的今天，她早已选择了一条更具挑战的道路：致力于让人工智能理解我们所处的三维物理世界。

通过梳理她过去一年间的十个核心观点，我们可以更清晰地窥见她所专注的领域——世界模型，以及她对AI未来发展与社会影响的深刻思考。其中，最后三点关于价值观与勇气的论述尤为精彩。

1 世界是无限的

哲学家维特根斯坦曾说：“语言的界限就是世界的界限。”李飞飞对此进行了扩展。她认为，语言界定了世界可以用符号描述的边界，但在此之外，世界实际上是无限的。

那么，我们如何定义并让机器表达这个无限的世界？这引向了“世界模型”的概念。这个世界模型当然与语言相关，但也关乎表达、呈现乃至最终参与到世界状态的变化中。它可以是虚拟的，也可以是物理现实的。它包含语言，因为人类的语言是与世界对话的一种方式，但这个世界还包含视觉、光线、语义、空间、物理行为等等。李飞飞创办的World Labs（世界实验室），其使命正是让AI学会理解人类所处的真实世界。

李飞飞肖像与图灵人工智能Logo

2 世界模型的应用范围也是无限的

既然世界是无限的，那么AI可理解的世界模型，其应用范围自然也是无限的。李飞飞指出，许多创作者擅长多种媒介，无论是电影、雕塑还是数字艺术，那是一个极具创意、互动性极强的世界，无法仅用语言来表达。

如今，利用AI生成可沉浸其中并与之互动的内容，已是一种世界模型的应用，它极大地吸引了艺术家。但这不仅仅关乎娱乐与叙事，它同样可以用于工业设计、医疗保健与医学教育。被动接受娱乐与主动参与体验之间的差别正在迅速缩小。让机器创建世界模型以实现沉浸式体验，潜力巨大。

充满未来感的科幻城市景象

3 最大的挑战是数据

构建AI世界模型面临诸多困难，而李飞飞认为，最大的挑战在于数据。用于训练AI理解世界的数据，并不像语言数据那样易于获取，其中最关键的形态是视频数据。

我们的世界是多模态且具有强烈空间性的。多模态意味着它丰富多彩，包含了三维信息、几何形状、物理特性和动力学等诸多方面。然而，这些信息中的大量部分并不容易像人类语言数据那样被轻易获取和标注。

冰山顶部布满发光屏幕的数字艺术图

4 感知的目的是为了运动

在思考AI如何发展出感知能力时，李飞飞从进化论中获得了启示。大约5.3亿年前的寒武纪生命大爆发，物种激增，同时神经系统（起初是感光细胞）开始出现。她悟出一个关键点：动物感知能力的进化目的，实际上是为了活动、运动和互动，这是一种主动而非被动的感知。这意味着人类的感知智能是以运动为基础的。

最初的运动很简单，只是将身体从一个位置移动到另一个位置。而今天人类的运动能力非常复杂，这种对我们所处空间具有细致复杂理解的能力，正是人工智能机器人或称“具身智能”的核心所在。

发光的粉紫色大脑与触手状生物结合的数字艺术

5 人类文明仅靠语言不可能实现

李飞飞举了两个例子来说明空间智能的重要性。一是古埃及金字塔，它体现了人类对抽象几何和空间几何的感知与大型物体建造能力，这绝非仅靠语言就能实现。

另一个例子是DNA双螺旋结构的发现。英国物理学家罗莎林德·弗兰克林拍摄的DNA分子X射线衍射照片（呈现出十字形图案），为后来詹姆斯·沃森和弗朗西斯·克里克推导出三维结构提供了关键的空间图像线索。你无法仅凭语言就得出这样的推论。这些都是人类运用空间推理能力的绝佳例证。

描绘DNA双螺旋结构与金字塔的手绘线条图

6 AI仍然处在低估期

对于人类社会而言，能够理性思考并付诸行动的能力至关重要。 任何能实现这一点的技术都极具价值。因此，作为一种全新的计算范式，AI当前并未被过分夸大。

看看我们周围的世界，芯片无处不在——从灯泡、自动驾驶汽车到飞机。芯片是发生计算的物理场所，哪里有芯片，哪里就有计算，而哪里有计算，未来哪里就会有AI。从这个角度看，AI无疑代表着未来。

发光的电路板纹理球体与数据光带

7 机器人的路还长

尽管AI代表未来，但要让机器人达到足够的智能水平，还有很长的路要走。回顾汽车工业史：从塞巴斯蒂安的第一辆自动驾驶汽车在内华达沙漠行驶130英里，到Waymo在旧金山实现商业化运营，花了20多年。而汽车工业及其供应链在此之前已发展了一百多年。

从AI机器人的视角看，汽车是一种简单的机器人，因为它本质是在二维平面上移动的方盒，主要目标是避免碰撞。而AI机器人的本质在于它是三维世界中的机器，其目标恰恰是为了接触物体——只不过要以正确的方式接触。

赛博朋克风格城市中的巨型机械生物

8 人工智能需要以人为本

李飞飞强调，她所倡导的是以人为本的人工智能，其核心包含三个基本价值观：尊严、自主性和社群。她认为这是AI通向通用智能道路上必须具备的。

尊严：面对强大的技术，人类常自问：我们由什么定义？如果一项技术能保护所有人的尊严感，尤其是最弱势群体的尊严感，那将无比激动人心。
自主性：她的实验室核心原则是探索用AI增强而非取代人类能力。
社群：当前社会似乎被科技撕裂，面临信息茧房和情绪极化。AI正处于岔路口：一条路可能让AI凌驾于真实社交体验之上，根据我们的偏见定制内容；另一条路则是用AI帮助建设更好、更强大的社会，例如提供更优质的教育服务，帮助有阅读障碍的学生或为语言障碍儿童提供早期干预。

双手捧著有“尊严、自主、社群”字样的发光水晶球

9 信任无比重要

李飞飞指出，在AI时代，信任不能外包给机器。信任本质上是人类的特质，存在于个人、社区和社会层面。随着机器的计算、推理乃至自主行动能力日益强大，我们需要建立新的社会规范。

在这种新常态下，人们仍能借助AI工具彼此建立信任，并将这种更新的信任迭代融入社会治理模式。这不仅关乎个人生活，也关乎整个社会的运行。信任至关重要，因为你服务的永远是人、是企业。必须让人的主动性成为信任的来源，而非指望机器自主产生信任行为。

深蓝色背景上的发光节点与动态网络结构

10 勇于面对不确定性

李飞飞认为，科学家需要无所畏惧（fearless），企业家更是如此。“无畏即自由”（Fearless is to be free）。这意味着需要摆脱束缚我们创造力、勇气和行动力的枷锁。

她动情地说道，人类并非地球上最快或最强的动物，但在我们的大脑、思想和灵魂深处，存在着某种驱动力，促使我们为世界、为自己、为彼此做出不可思议的事。这很大程度上源于人类的创造力和社群意识。为了在科技时代释放这种潜能，最根本的情感准则是：要有创造力，而这最终转化为：要无所畏惧。

要勇于面对不确定性，勇于面对尚未有人实现的想法，勇于面对逆向思维的假设，勇于面对艰巨的任务。容易的任务、确定的任务，有时与不确定的任务同样困难。去选择那些具有不确定性的任务。因为你知道，你的自由和创造力会更加努力地运转，而那正是奇迹发生的地方。

凝视科幻能量拱门的未来装甲战士

这体现了一种宝贵的科学精神。了解李飞飞的生平会发现，她一路走来，绝不是在“容易”和“困难”之间选择，而是在“正确”和“容易”之间选择。她所投身的世界模型领域，就是那条她选择的“正确的路”。而正确的路，往往更为艰难。

她未必总是正确，但她无疑是一位勇敢、充满勇气的人。

你对李飞飞教授关于世界模型和AI发展的观点有何看法？她的研究方向是否预示了AI的下一个突破点？欢迎在云栈社区的“开发者广场”板块分享你的见解，与更多技术爱好者一同探讨人工智能的未来。

上一篇：ChatGPT直言：人类文明或在25年内退场，但忽略机制早已开始
下一篇：2026安兔兔V11实测洞察：手机跑分榜单新维度，解码散热与温控

人工智能, 计算机视觉, 机器人, 世界模型, 多模态人工智能