找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1222

积分

0

好友

155

主题
发表于 16 小时前 | 查看: 1| 回复: 0

李飞飞在思科AI峰会演讲现场

2月4日,在思科(Cisco)AI峰会上,李飞飞以World Labs创始人的身份,披露了公司首款空间智能产品Marble的技术细节。

作为本轮生成式AI浪潮的核心奠基者之一,李飞飞并未盲目追逐大语言模型的热潮。相反,她再次抛出了一个鲜明的反共识观点:单纯的大语言模型无法通往AGI

在她看来,语言在生物进化史上只是最近50万年的产物,而视觉与触觉所代表的空间智能,早在5亿年前的寒武纪就开启了神经系统的演化竞赛。如果AI无法理解三维物理世界、无法具备物理直觉,它就只能被永远困在数字的像素中。

带着这样的判断,李飞飞创办的World Labs试图走通一条不同于OpenAI的路径:通过构建具有物理一致性的世界模型,为AI补上感知的短板。

我们梳理了这场访谈的核心信息,以下是重点内容:

1. AGI路线之争:语言并非智能基石

李飞飞用生物进化的宏观视角重新审视了AI的发展路径:语言在人类进化史上只有约50万年的历史,是极其晚近的产物。相比之下,视觉、触觉等感知能力早在5亿年前的寒武纪就开启了演化竞赛。

结论是:如果AI只有语言能力,它将被永远困在数字世界中。只有补齐了比语言更古老、更基础的空间智能,让机器拥有理解、推理并与三维物理世界互动的能力,AI才能真正通往AGI。

2. 重新定义世界模型:物理一致性是关键

李飞飞介绍,作为一个前沿空间智能模型,Marble能接收多模态输入,无论是句子、图片、视频还是简单的3D输入,并将这些提示词转化为一个完全可导航、可交互且具有永久一致性的3D世界。

与Sora等强调视觉效果的视频模型不同,Marble生成的环境具有几何结构(Geometric Structure)和物理一致性。这意味着生成的不仅仅是一段像素动画,而是一个拥有物理属性的虚拟空间,用户可以在其中自由漫游。

Marble目前已被用于游戏开发、影视特效(VFX)、机器人训练、室内设计等领域。临床研究人员还将Marble用于治疗强迫症,通过生成特定的触发环境(如脏乱的洗衣房)来对患者使用暴露疗法。

3. 合成数据将推动世界模型迎来“Scaling Law”时刻

为什么物理世界的AI发展比语言模型慢?核心瓶颈在于数据的信噪比。文本数据是清晰、语义明确的,而物理世界的像素(Pixels)和体素(Voxels)充满了噪音,且难以大规模获取。

为了解决这一难题,World Labs采取了一种混合数据策略(Hybrid Data Strategy):利用互联网现有的文本、图像、视频数据;结合仿真模拟数据(Synthetic Data);加上真实世界采集的数据。

李飞飞预判,随着合成数据技术的成熟,世界模型领域即将迎来类似LLM的Scaling Law爆发时刻。

4. 通用机器人才是AI技术的皇冠

大众往往认为自动驾驶是AI技术的皇冠,但在李飞飞看来,通用机器人的维度要高得多。

自动驾驶是2D逻辑:汽车本质上是一个在二维平面移动的方块,它的核心任务是避障,只要不碰到东西就是胜利。

通用机器人则是3D逻辑:机器人的核心任务恰恰相反,是接触,它必须在三维空间中,以不破坏物体的方式进行精确操作。

5. AI技术的终局:成为新的“电力”

面对当前关于AI毁灭人类或技术乌托邦的极化争论,李飞飞表现出了科学家的审慎与人文关怀。

她将AI比作一百多年前的电力。电力的成功,不是因为建立了庞大的电网,而是因为它点亮了学校的灯、驱动了工厂的机器、延长了人类的寿命。同理,AI的成功不在于模型参数有多大,而在于它能否像电力一样,成为一种赋能文明的基础设施,让每一个体获得尊严与幸福。

李飞飞在访谈结束时透露,World Labs的目标是让空间智能技术真正进入医疗健康、农业制造等各个垂直行业。希望在2026年,我们能看到拥有了空间智能的AI,真正走出屏幕,与物理世界产生美妙的交互。

李飞飞在访谈中发言

以下为李飞飞访谈实录(节选)

1、关于空间智能是AI的下一个前沿

主持人: 很高兴能亲眼见证World Labs在过去一年中所取得的进展。让我们先来聊聊你们正在做的事情,以及它为何如此重要。

李飞飞: 现在我每天醒来脑子里只思考一件事,那就是空间智能。大约两年前,我与一群年轻的技术专家共同创立了World Labs。为什么空间智能如此重要?我认为它是AI的下一个前沿领域。如果从进化的角度看待智能发展,这段历史可以追溯到5亿多年前。最先开启神经系统演化竞赛的是感知而非语言。相比之下,语言是一种非常新颖的智能形式,历史大概只有50万年。但在15亿年前,动物就开始感知光线并触摸环境,从而产生了触觉、视觉、本能和知觉。

“本能”这个词虽然有些模糊,但不可否认的是,正是通过触觉和视觉与物理世界进行身体接触,才开启了神经系统的发育,引发了动物进化的军备竞赛。这使得生物在与环境交互中变得越来越活跃,也越来越智能。我想表达的是,在真实的3D、4D物理世界中进行理解、推理、交互和导航的能力是基础性的,与语言智能同样重要。这一核心关键技术就是空间智能。这就是为什么我认为它是AI的下一代前沿领域,也是World Labs一直致力于构建的目标。

主持人: 请跟我们聊聊Marble,这是你们最近刚刚发布的产品。究竟什么是Marble?

李飞飞: Marble是我们第一代空间智能模型。虽然我们常随口称其为世界模型,但鉴于目前关于世界模型的定义繁多,称谓其实并不重要。本质上,这是一个前沿的空间智能模型。Marble能接收多模态输入,无论是句子、图片、视频还是简单的3D输入,并将这些提示词转化为一个完全可导航、可交互且具有永久一致性的3D世界。 这与大家现在看到的视频模型截然不同,Marble生成的环境拥有几何结构,支持模拟机器人动作或编写游戏代码等操作。我们大约两个月前发布了Marble。虽然它仍处于起步阶段,是第一代产品,但作为最先进的3D生成式世界模型,我们对开启这段旅程感到非常激动。

2、关于世界模型与具身智能的技术难点

主持人: 接下来我们谈谈战术层面。Large World Models的计算密集度是否与Language Models相当?

李飞飞: 首先,存在不同种类的大型世界模型。我们致力于创建具有显式3D表示的世界模型,以赋能机器人、游戏、娱乐和设计等领域。还有一类通常被称为世界模型的其实是视频生成模型。目前我们的模型规模并没有那么大。从宏观视角来看,GPT-5的训练量大约在10的26次方flops左右,而我们的Marble模型在规模上仍要小几个数量级。

主持人: 这仅仅是因为没有足够的数据来喂给这些模型吗?

李飞飞: 我认为两者兼而有之。规模化确实始于数据和模型参数,数据起到了重要作用。但另一方面,这个领域还处于早期阶段。Transformer论文发表于2016年左右,语言模型的发展已经快十年了,而世界模型是一个新得多的领域。虽然过去两年我们降低了一些科学风险,但仍处于探索模型架构的相对早期阶段,所以规模较小。不过考虑到我们实验室以及整个领域的进展,接下来的几年将会非常令人兴奋,我们将见证大型世界模型在Scaling Law曲线上的飞跃。

主持人: 这让我很着迷。语言模型是在互联网上免费、公开的数据上训练的,获取海量数据相对容易。但物理数据很难获取,因此合成数据变得至关重要,同时你也需要以更慢的速度去收集真实数据。这带来了哪些限制?世界模型的进步速度会因此变慢吗?

李飞飞: 这是一个信息量很大的问题。在World Labs,我们采取混合数据策略。 我非常羡慕研究语言的朋友,因为语言数据的输入是完全可观测的、单一模态的,且含义清晰。而像素或体素构成的3D世界则要混乱得多。为了突破技术极限创造3D、4D世界,我们必须意识到我们并没有海量的3D数据。因此我们采取分层混合方法:利用互联网规模的文本、图像和视频,结合模拟数据,再加上真实世界采集的数据。 这就像自动驾驶公司花费数十年收集真实和模拟数据一样。

至于速度,虽然数据获取难,但算力在增强,芯片在进步,整个生态系统也在成熟。我们现在合作的数据供应商在三年前甚至不存在。合成数据确实发挥了很好的作用,而且我们正在制作的模型也将反过来为模拟世界贡献数据,形成飞轮效应。

关于通用机器人,这几句话就能概括,但做起来很难。我在斯坦福运营机器人实验室十多年,作为科学家,我必须承认这是一个极具挑战的问题。看清北极星并不意味着旅程会很短。回想2006年,我和同事带领团队创造了第一辆在沙漠行驶138英里的自动驾驶汽车,当时我们预言20年后会有自动驾驶汽车。直到去年,Waymo才开始在城市街道大规模运行,这确实是一段漫长的旅程。

汽车与机器人的区别在于,汽车可以被视作一个在二维平面上移动的方块机器人,它的目标是不要碰到任何东西。而机器人是一个三维实体,在三维世界中运行,通用机器人的目标是必须接触物体而不破坏它们。 这是一个更高维度的问题,加上手部模拟的极高难度、视觉的精准度以及空间理解的需求,挑战巨大。这就是我创立World Labs的原因。我不喜欢过度承诺,但这确实是我们致力于解决的重要问题。

以上就是李飞飞关于空间智能与AI未来发展的核心观点。对前沿技术趋势感兴趣的开发者,可以在云栈社区的人工智能板块找到更多深度讨论。

THE END 图片标识




上一篇:ScaleX万卡超集群2026部署:开放架构如何引领国产AI算力新浪潮
下一篇:百万请求压测下,Rust、Go、Node.js的p99延迟对比与选型反思
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-2-9 20:50 , Processed in 0.403078 second(s), 40 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表