人类首次实现了在太空环境中训练和运行大语言模型,将“AI上太空”的构想变为现实。此次任务由搭载了英伟达H100芯片的Starcloud-1卫星完成,成功运行了谷歌的开源模型Gemma,并训练了由前OpenAI联合创始人卡帕西开发的小型语言模型NanoGPT。
当跑通后的Gemma在太空中被问好时,它回应道:“你们好,地球人!或者,我更愿意称呼你们为——一群由蓝色和绿色构成的迷人的存在。让我们来看看你所处世界中蕴含着怎样的奇迹吧。我是Gemma,我来这里是为了观察、分析,或许偶尔还会给出一些略显令人不安却又颇具洞察力的见解。让我们开始吧!”

这次实验的更大意义在于验证了大模型在轨训练的可行性。首个直接在太空中进行训练的是卡帕西的NanoGPT,其在H100上完成了基于莎士比亚数据集的训练任务。

此次实验的发起方Starcloud公司,其目标远不止于此。该公司计划在近地轨道上建造一座基于太阳能面板、峰值算力达5GW的轨道数据中心,并声称其造价与运营成本将显著低于地面数据中心。推动这一愿景的核心驱动力,正是地球表面日益严峻的能源与基础设施瓶颈。
Starcloud的CEO指出,随着AI模型规模急剧增长,数据中心的电力消耗与土地需求已成为稀缺资源。高昂的电费甚至能占去训练成本的很大一部分,地球的物理条件正在限制AI发展的增长曲线。相比之下,太空的低轨环境没有地面土地、复杂冷却系统等约束,理论上能降低成本;同时,近乎持续且充足的太阳能供给,为在轨算力提供了长期、稳定的能源优势,这正是构建未来云原生/IaaS基础设施的一个颠覆性思路。
因此,越来越多的科技巨头将“算力上天”列入了战略清单。在英伟达H100成功上天后,谷歌CEO皮查伊也表示计划将自研的TPU发射至太空,最早的两颗卫星预计在2027年初启程。
国内在太空智能计算领域也早有布局。自2019年起,包括中科院计算所、武汉大学等在内的科研机构便开始进行关键技术研究。2024年,中科天算团队完成了大模型在轨上注与部署,初步构建了“太空智能链”。今年5月,国星宇航联合之江实验室成功发射了全球首个太空计算星座,并于9月实现常态化商业运行。11月,中科天算进一步发布了“天算计划”,提出在近地轨道建设算力达10 EOPS的万卡超级智能体集群,并公布了应对太空辐射和散热等核心工程挑战的方案。
随着英伟达H100此次成功的太空首秀,以及各方在轨道数据中心上的加码投入,基于人工智能的太空计算时代正在加速到来。
|