找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2378

积分

1

好友

331

主题
发表于 2025-12-25 19:47:04 | 查看: 33| 回复: 0

“空间智能”是AGI的一把关键钥匙。

世界远不止语言那么简单

从宏观技术信念上说,我坚信这个世界远不止语言那么简单。当我们谈论“语言”时,它通常指一种离散的、本质上更偏向“一维”的信息载体。但现实世界要丰满和复杂得多。

空间智能包含物理属性等诸多特性,这些都超越了语言的范畴。无论是人类的行为还是自然界的运转,许多事物都无法用语言完全表述,更不可能仅凭语言就实现所有目标。我们每日的生存、创造、感知以及人与人之间的情感交流,从来都不是仅靠语言就能完成的。

当然,“语言即世界”作为一种高度概括的说法,听起来并无不妥。但从技术实现的底层逻辑看,当下的数字化浪潮中,视觉模型、空间智能、机器人模型最终都会走向数字化表达。若将“数字”与“语言”完全等同,这个概念就失去了其特异性。如果任何事物都能被宽泛地称为“语言”,那么讨论也就失去了意义。

在我看来,信息的形式是多样的。空间信息与语言信息同等重要,同样美妙。

“空间智能”到了爆发前夜

当前的AI领域弥漫着一些激进的期待。而我选择此时创业的核心原因,正是判断技术爆发的时间点已经临近。

创业与科研不同,必须尊重市场规律。而成功的关键往往在于精准把握时机——不能太早,也不能太晚。对于空间智能技术而言,目前正处在爆发式增长的前夜。视频生成技术的飞速发展,以及我们所探索的“世界模型”(World Models),都预示着未来一两年内,这项技术将迎来质的飞跃,其市场应用前景也将愈发清晰。

我们现在所做的“世界生成”(world generation)模型令人尤为兴奋。它的应用场景极其广泛,涵盖数字创意、游戏开发、影视制作、建筑设计、VR/XR/AR以及机器人仿真等领域。在这些领域中,存在着对三维空间内容的强烈需求。

生成式AI的核心价值之一,在于它能显著降低高难度任务的门槛,从而开辟全新的市场。 创建三维内容原本是专业度极高的工作,需要熟练使用Blender、Unity等复杂工具,这阻挡了无数拥有创意的普通人。AI不仅能赋能现有创作者,更能让更多“局外人”发现并释放自己的创造潜力。

因此,三维世界生成模型的意义重大:它将一项高门槛的能力民主化,这本身就是巨大的市场机会。

在我看来,没有空间智能,没有三维世界的生成式模型,就谈不上真正的AGI(通用人工智能)。AGI如同一扇需要多把钥匙才能开启的大门,而空间智能无疑是其中关键的一把。这个梦想的实现并非一蹴而就,而是被逐步推开的。无论称之为AI还是AGI,其核心目标都源于对“机器能否思考与自主行动”的科学好奇心。而空间智能,是实现这一目标不可或缺的重要环节。

算法与数据,都是AI的核心

在AI的发展中,算法与数据的关系是螺旋式上升的,两者从未离开过核心地位。AI在数学层面的核心挑战是“泛化”(generalization),而实现泛化依赖于两大支柱:算法数据,且二者密不可分。

算法过于复杂而数据不足会导致过拟合;反之,海量数据搭配欠佳的算法同样会导致过拟合——这背后有清晰的数学逻辑。作为计算机视觉领域早期从事机器学习研究的博士生,我深刻体会到了数据对于模型泛化能力的重要性。从ImageNet推动计算机视觉发展,到互联网文本催生大语言模型,再到视频数据驱动视频生成、路况数据赋能自动驾驶,每一次飞跃都离不开高质量数据的支撑。

尽管算法听起来更“酷炫”,但真正身处AI行业的人都明白,数据的科学价值与算法至少是同等重要的。

空间智能,赋能于“机器人”的发展

1. 自动驾驶是简化版的世界模型
自动驾驶汽车可以说是最早实现量产的机器人,但其场景是高度受限的——基本在二维平面移动,核心任务是“避免碰撞”。而未来我们期待的三维机器人,需要在复杂的三维空间中主动与环境交互,完成如洗碗、叠衣等任务。因此,自动驾驶对应的世界模型也相对简单。这并非贬低其成就,但从科学与宏观的机器人技术视角看,这只是个开始。

机器人训练尤其离不开生成式模型,因为很难收集到足够覆盖所有场景的真实数据。此外,在创意、设计等我们的核心应用场景中,“生成”能力本身就是需求。

2. 机器人的三维能力尚处早期
当前机器人领域备受关注,但我认为仍需冷静看待:它仍处于发展的早期阶段。核心挑战之一正是数据匮乏。与拥有几十年数据积累的汽车行业不同,消费级机器人尚无成熟的商业化场景来自然产生数据。

生成式AI的兴起,为机器人领域指明了一条充满前景的路径。 例如,视频生成技术不仅提供了丰富的训练数据想象空间,还能用于高拟真度的机器人仿真,甚至在推理阶段辅助在线规划。周边技术的快速发展,正有力地推动着机器人技术的进步。

机器人实现大规模商业化,特别是消费级应用,还有很长的路要走。尽管AI层面的进展会比自动驾驶早期更快,但机器人需要应对的是完整、复杂的三维物理世界。目前的空间智能水平,距离人类对三维世界的直觉理解还相差甚远

AI的未来:人类有责任让其“向善”

1. 机会,并非赢家通吃
在AI时代,数据、算力、人才的整合能力固然重要,但这并非成功的全部。显性资源容易被看见和追捧,但创造力、机遇把握、执行力以及对时机的精准判断,才是更关键的决定性变量。

AI作为一项横向技术,催生了无数垂直应用机会,大公司无法全部覆盖。这为创业公司提供了广阔空间:将某个特定应用做到极致,完全有可能实现突破。

2. AI只是工具
“AI是工具”这是一个基本共识。如同人类历史上的所有工具,从火、石斧到核技术,它本身具有双刃剑属性。我们必须致力于引导其向善,并防范误用。两种极端都不可取:只追求发展而忽视安全是灾难;空谈伦理而停滞发展则会错失技术福祉。

AI是权力的工具,也是向善的工具,但在其变得不可控之前,它始终属于人类。控制与引导AI,是法律、制度、教育乃至整个社会的共同责任。

3. 教育体系到了彻底变革的时刻
AI时代迫切要求我们彻底更新教育理念。目标应是教会下一代如何利用AI赋能学习与创造,同时理解其风险。值得注意的是,最需要接受相关教育的或许是成年人自身,包括政策制定者与公众。

归根结底,AI的发展与治理问题,本质上是人类自身的学习、发展与治理问题。AI作为一个具备智力能力的工具,其最大的启示或许是促使我们更好地进行自我审视与治理。

面对时代剧变,个体应保持好奇心与学习动力。而从群体层面看,当前最亟需革新的是沿袭百余年的教育体系。当AI能替代大量知识性、重复性工作时,继续让人类花费十数年进行“知识填充”无疑是对潜能的巨大浪费。

我期待借助AI赋能教育者与学生,将节约出的时间与精力,用于培养AI难以替代的认知能力、创造力和批判性思维。人类的潜力远未被充分开发,而AI带来的冲击,恰恰是重构教育、激发每个人深层潜能的契机。真正的教育变革应打破工科与文科的壁垒,因为AI让编程更普及,也让人文艺术的创作更触手可及。

关键始终在于人如何使用工具。我最担忧的是人类放弃自身的能动性(agency),产生“AI如此聪明,有没有我都一样”的“躺平”心态。这将是危险的。我们信仰的应是人类的潜力与韧性,而非工具本身。探索通用人工智能的道路上,人的角色永远是无法被替代的核心。

空间智能示意图




上一篇:《我的世界》中国版重构开发者分成协议,UGC生态激励政策深度解析
下一篇:RDMA技术详解:InfiniBand与RoCE核心差异、协议对比及AI大模型训练场景选型
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-1-11 10:52 , Processed in 0.289110 second(s), 39 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2025 云栈社区.

快速回复 返回顶部 返回列表