AI究竟是什么?在NVIDIA首席执行官黄仁勋看来,它早已超越了聊天机器人或单一模型的范畴,正迅速演变为一种“新型基础设施”。最近,他在英伟达官网发布长文,用一个生动的比喻来解释这一观点——AI就像一块“五层蛋糕”。

从最底层的能源供给,到上层的芯片、基础设施、模型,直至最顶端的各类应用,人工智能正在构筑一套完整的产业技术栈。它正如同电力和互联网一般,逐渐成为支撑现代社会的底层能力。
这也是黄仁勋自2016年以来发表的第七篇公开长文。文中,他从计算机发展史与第一性原理出发,试图阐释AI技术栈为何演化成如今的形态,以及全球为何会掀起一场规模空前的AI基础设施建设浪潮。
在他看来,过去几十年的软件大多是预先编写好的程序:人类设计算法,计算机执行指令,数据被结构化存储在数据库中等待精确查询。而AI的出现彻底打破了这一模式——计算机开始能够理解图像、文本和声音,并能够根据上下文实时生成答案、进行推理甚至创造新内容。
正因为“智能”不再是预先写死的代码,而是实时生成的能力,支撑其运行的整个计算体系也必须被重新设计。从能源供应、芯片架构到数据中心建设,AI正在驱动一轮规模空前的基础设施革新。
不过,黄仁勋也提醒,这场变革仍处于早期阶段:大量基础设施尚未建成,大量人才有待培养,巨大的机会也远未被充分释放。
AI 是基础设施,而非单一应用
AI是当今塑造世界最强大的力量之一。它并非仅仅是一款巧妙的应用程序,也不是某个单一的模型,而是一种就像电力和互联网一样的基础设施。
AI依赖真实的硬件、真实的能源以及真实的经济体系运行。它能够将原材料大规模地转化为“智能”。未来,每家公司都会使用AI,每个国家或地区都会建设AI。
要理解AI为何会以这样的方式发展,最好的方法是从第一性原理出发,审视计算领域发生的根本性变化。
从“预先编写”到“实时生成”的范式转移
在计算机发展的绝大多数历史中,软件都是预先写好的。人类描述算法,计算机执行。数据必须被精心组织,存储在表格中,再通过精确查询(SQL成为此模式的关键工具)进行检索。
而AI打破了这一固有模式。
我们首次拥有了一台能够理解非结构化信息的计算机。它可以识别图像、阅读文本、理解声音。它能够根据上下文和意图进行推理。更重要的是,它能够实时生成智能。
每一次回答都是全新的。每一次回应都取决于你提供的上下文。这不再是软件从数据库中取出预先存储的答案,而是软件在实时推理,并按需生成智能。
正因为智能是实时产生的,支撑它的整个计算技术栈也必须被重新设计。
AI 的五层“蛋糕”技术栈
如果从工业视角审视AI,它可以被拆解为一个清晰可见的五层技术栈。

第一层:能源
最底层是能源。实时生成智能需要实时消耗电力。每一个生成的token,本质上都是电子流动、热量被管理、能源转化为计算能力的结果。在这一层之下,没有任何抽象。能源是AI基础设施的第一性原理,也是决定系统能产生多少智能的硬性约束。
第二层:芯片
能源之上是芯片。芯片是专门设计的处理器,用于高效地将能源转化为计算能力,并且能够在极大规模下并行运行。AI工作负载需要极高的并行度、高带宽内存以及高速互联。芯片层的进步,决定了AI扩展的速度,也决定了智能的成本能降低到什么程度。
第三层:基础设施
芯片之上是基础设施。这一层包括土地、电力输送、散热系统、建筑、网络,以及能够把数万颗处理器组织成一台超级计算机的系统。这些系统本质上是 “AI工厂” 。它们的设计目标不是存储信息,而是制造智能。
第四层:模型
基础设施之上是模型。AI模型能够理解多种模态的信息:语言、生物、化学、物理、金融、医学,以及现实世界本身。语言模型只是其中的一类。目前最具变革性的进展,还发生在蛋白质AI、化学AI、物理仿真、机器人、自动驾驶系统等领域。
第五层:应用
最顶层是应用,也是创造直接经济价值的地方。例如:药物研发平台、工业机器人、法律助手、自动驾驶汽车。一辆自动驾驶汽车,本质上是嵌入在机器中的AI应用;一台人形机器人,则是嵌入在身体中的AI应用。底层技术栈相同,但最终的应用形态千差万别。
这就是AI的五层蛋糕结构:能源 → 芯片 → 基础设施 → 模型 → 应用。
每一个成功的应用,都会向上拉动模型需求,向下传导至基础设施、芯片,并最终追溯到为整个系统供电的能源层。
巨大的建设浪潮与人才需求
AI的基础设施建设才刚刚开始。目前的投入规模仅有数千亿美元,而未来可能需要建设数万亿美元规模的基础设施。
在全球范围内,芯片工厂、计算机制造工厂和AI工厂正以前所未有的速度拔地而起。这正在成为人类历史上最大规模的基础设施建设之一。
支撑这场建设所需的劳动力规模极其庞大。AI工厂需要电工、管道工、钢结构工人、网络技术员、安装和运维人员等大量技能型岗位。这些往往是高收入的工作,并且目前供不应求。参与这场变革,并不需要计算机科学博士学位。
与此同时,AI也在推动知识经济领域的生产力提升。以放射科为例,AI可以辅助医生读取医学影像,但放射科医生的需求仍在增长。这是因为医生的核心使命是照顾患者,解读影像只是其中一项任务。当AI承担更多重复性工作后,医生能将时间更多用于判断、沟通和直接护理,从而提升整体医疗效率和服务容量。生产力提升带来能力增长,进而创造更多就业和价值。
开源模型的催化作用与未来展望
在过去一年,AI跨越了一个关键门槛——模型性能显著提升,已能在真实的大规模场景中发挥切实作用。推理能力提高,幻觉减少,落地应用能力大幅增强。基于AI构建的应用开始创造真实、可衡量的经济价值。
在药物研发、物流、客户服务、软件开发和制造业等领域,AI应用已展现出强大的产品市场契合度。这些应用正在强烈地拉动底层技术栈的需求。

全球绝大多数开源模型都是免费开放的,它们在这一过程中扮演了关键催化剂的角色。研究人员、初创公司、企业乃至国家,都依赖开源模型来参与和推动先进AI的发展。当一个强大的开源模型(例如DeepSeek-R1)达到前沿水平并被广泛采用时,它不仅加速了应用层的创新,更会激活整个技术栈——从训练、基础设施到芯片和能源——的需求增长。
如果把AI看作一种基础设施,其影响就变得异常清晰。这场始于Transformer架构与大语言模型(LLM)的变革,其意义远不止于技术本身。这是一场工业级的重塑,正在改变能源的生产与消费方式、工厂的建造模式、工作的组织形式以及经济的增长路径。
如今,AI工厂的兴建是因为智能需实时生成;芯片被重新设计是因为效率决定了智能扩展的规模;能源变得至关重要因为它设定了智能产出的上限;应用层正在加速则是因为底层模型已跨过可用的门槛。
每一层的发展都在强化其他层。这就是为什么AI基础设施的建设规模如此庞大,并能同时影响众多行业。AI不会局限于某个国家或行业,它将成为一种普适性力量。
我们仍然处于这场变革的早期阶段。大量基础设施尚未建成、大量人才尚未完成培训、大量机会尚未被发掘。但未来的方向已经非常清晰。
人工智能正在成为现代世界的基石。而我们当下在技术路线、建设速度、参与广度以及如何负责任地部署AI等方面做出的选择,将最终决定这个智能时代的样貌。对于广大开发者和技术从业者而言,理解这一宏观趋势,或许比掌握某个具体框架更为重要。想了解更多前沿技术趋势与深度讨论,欢迎访问云栈社区。