
在最新的Lex Fridman播客深度访谈中,英伟达创始人兼CEO黄仁勋分享了他是如何依靠推理和意志的力量来塑造未来的。从推动CUDA战略,到引领公司转型为AI基础设施巨头,他的思考揭示了技术变革背后的深层逻辑。
访谈中,黄仁勋也透露了他独特的管理哲学:通过公开推理塑造团队信念、以物理极限为基准去除冗余复杂性,并将压力分解为可执行清单。以下为访谈全文的紧凑整理。
黄仁勋如何管理英伟达:从芯片到机架的协同设计
Lex Fridman:你将英伟达推向了AI新纪元,从芯片级设计转向了机架级设计。在这种包含众多复杂组件的系统中,协同设计最难的部分是什么?
黄仁勋:之所以需要极致协同设计,是因为现在要加速的问题已经无法装进一台电脑或由一个GPU解决了。目标是让性能提升远超计算机增加的数量。这时你必须拆解算法,对流水线、数据和模型进行分片。在这种规模的分布式计算中,CPU、GPU、网络、交换机全是问题。系统的加速比取决于任务中可并行部分的比例,这就是阿姆达尔定律。我们必须动用所有技术,否则只能实现线性增长。
Lex Fridman:你如何把内存、网络、光学等不同领域的顶尖专家聚在一起解决问题?
黄仁勋:这就是为什么我的直属下属规模如此庞大,有60多人,且几乎都是专家。我从不和他们进行一对一面谈,因为那没法干活。公司的目标就是成为一台机器、一套机制、一个系统,来生产输出结果。公司的架构应该反映它所处的环境。

Lex Fridman:所以任何对话都不是一对一的?
黄仁勋:没错。我们提出一个问题,大家一起攻击它。因为我们在做极致协同设计,公司随时都在进行这种协作。他们可以贡献意见,不想听的人可以退出,但在我团队里的人知道什么时候该留意。
Lex Fridman:英伟达如何从游戏GPU转向AI工厂?关键节点是什么?
黄仁勋:起步于加速器公司,但应用领域太窄。过度专业化会限制市场触达,进而限制研发能力和影响力。终极目标是实现“加速计算”,但公司必须在一步步扩大计算范畴的同时,不放弃最重要的专业化。我们跨出的第一步是发明了“可编程像素着色器”,第二步是加入IEEE兼容的FP32,最终引向了CUDA。
Lex Fridman:在GeForce游戏显卡上搭载CUDA,据说当时是一个极其艰难的战略决策?
黄仁勋:那是第一个接近“生存威胁”的战略决策。问题是:如何吸引开发者?计算平台的核心是开发者,他们因为安装基数大才来。安装基数定义架构,其他都是次要的。 当时我们决定,把CUDA装进每一颗GeForce GPU,用这个作为培养安装基数的起点。CUDA大幅增加了消费级GPU的成本,吞噬了公司所有的毛利。公司在低谷徘徊了很久,但我们始终坚持。
Lex Fridman:这个决定后来成了深度学习革命的基石。你当时如何拥有这种跳跃式预测未来的智慧?
黄仁勋:首先,我被强烈的好奇心驱动。在某个时刻,我的推理系统让我确信:这个结果一定会发生。当深信不疑时,你会显现出一个未来,那个未来如此令人信服,不可能不会发生。

Lex Fridman:你如何将这种预见传递给团队?
黄仁勋:很多领导者突然宣布一个新愿景,我从不这样做。当我学到新东西时,我会向身边所有人明确表达。我会利用每一个机会,从外部信息、新洞见、新工程突破入手,用这些来塑造他人的信念系统。我每天都在对董事会、管理层和员工做这件事。所以当我宣布重大决策时,对大家来说这已经是显而易见、不得不做的事情了。GTC大会很大程度上是在展示一个未来,并塑造行业伙伴的信念体系。
AI 缩放定律:智能的扩展终归结为算力
Lex Fridman:你长期以来一直坚信缩放定律。现在依然如此吗?
黄仁勋:是的,我们现在有了更多的缩放定律:预训练、后训练、推理时和智能体化缩放。
Lex Fridman:展望未来,你最担心哪些阻碍缩放的因素?
黄仁勋:回顾一下人们曾经认为的障碍。起初担心高质量数据缺失,但这显然不是真的。我们会继续扩大训练数据,其中很多将是合成数据。但他们忘了我们教给彼此的大部分信息其实也是“合成”的。现在AI能够提取基本事实并合成海量数据。后训练阶段,限制将转向计算能力。
推理时缩放是高度计算密集型的,因为“思考”很难。那之后是智能体化缩放定律。智能体系统会去做研究、查询数据库、使用工具,最重要的是它会派生出许多子智能体。智能的扩展最终归结为一件事:算力。
Lex Fridman:但你必须提前预判AI创新的方向。硬件架构周期大约3年,这很可怕,对吧?
黄仁勋:非常精准。AI模型架构大约每6个月进化一次,而系统和硬件架构大约每3年一个周期。你得预判两三年后的情况。 我们通过内部的基础研究和应用研究来做到这一点,我们也自己创造模型。同时,我们是世界上唯一一家与几乎所有AI公司合作的AI公司,在倾听全行业的“耳语”。CUDA的优势就在于它既是极致的加速器,又非常灵活。
黄仁勋:例如,上一代Grace Blackwell机架完全专注于处理大语言模型。而一年后的Vera Rubin机架就加入了存储加速器和新的CPU。原因在于,上一代是为了运行MoE大语言模型的推理而设计的,而这一代是为了运行智能体,智能体会频繁调用各种工具。
Lex Fridman:所以你在工具(如Claude Code)出现之前就预判了这种需求?
黄仁勋:只需要进行逻辑推理。为了让大语言模型成为一名“数字员工”,它必须能访问文件系统、进行研究、会使用工具。很多人说“AI将彻底摧毁软件”,这很荒谬。一个完美的人形机器人走进房间,是更倾向于使用现有的微波炉,还是从指尖发射微波?显然是用微波炉。
黄仁勋:我刚才描述的其实就是OpenClaw的几乎所有特性。当你顺着这条路理清逻辑,我认为我们刚刚重新发明了计算机。大约两年前我在GTC大会上展示的OpenClaw示意图,与今天的智能体系统如出一辙。我认为OpenClaw对智能体系统的意义,就像ChatGPT对生成式AI的意义一样,这是一件大事。

Lex Fridman:伴随强大技术的是安全担忧。你们如何应对?
黄仁勋:我们立即行动了。我们开发了一个叫OpenShell的东西,集成到了OpenClaw中。英伟达还推出了NemoClaw。我们提供“三选二”的权限管理:智能体系统可以访问敏感信息、执行代码、以及进行外部通信。如果我们在任何时候只给你其中两项能力而非全部三项,我们就能保证安全。
Lex Fridman:进一步缩放的障碍是什么?电力?
黄仁勋:电力是一个担忧。这就是为什么我们如此努力推动“极致协同设计”,以便每年都能将“每秒生成的token数/每瓦功耗”提升几个数量级。在过去10年里,我们通过协同设计,将算力提升了100万倍。虽然计算机价格在上涨,但我们生成token的效率提升得更快,所以token的成本每年都在下降一个数量级。
影响上下游:塑造未来的供应链
Lex Fridman:AI供应链中的瓶颈,比如EUV光刻机、CoWoS封装、HBM内存,会让你失眠吗?
黄仁勋:一直如此。历史上没有任何一家公司在保持如此规模的同时还能加速增长。我花大量时间告知合作方的CEO们,是什么动力在驱动这种持续甚至加速的增长。我的工作是告诉他们当前的业务状况、近期的增长驱动力,以及我们要去向何方,以便他们决定如何投资。
黄仁勋:以DRAM行业为例。大约三年前,我说服了几位CEO:尽管HBM内存当时仅在超算中极少量使用,但它将成为未来数据中心的主流。起初听起来很荒谬,但他们相信了我并决定投资。看看现在的HBM,销量惊人。这就是我的工作:告知、塑造并激励。
Lex Fridman:所以你真的不担心某些瓶颈吗?
黄仁勋:不担心。因为我已经告诉了他们我的需求,他们理解了,也告诉了我会怎么做,而我选择相信他们。我可以安然入睡,因为我确认过了。 当我们从DGX-1变为NVLink-72机架级计算时,意味着供应链每周就需要1吉瓦的电力来完成测试。NVLink-72本质上是在供应链中直接组装超级计算机,然后每次以两三吨重的机架形式发货。
利用公共闲置电力的构想
Lex Fridman:聊聊电力问题。你对解决能源问题有什么期待?
黄仁勋:我们的电网是按“最坏情况”并预留余量来设计的。然而,99%的时间我们都远未达到最坏情况。大部分时间电网大概只运行在峰值的60%。这意味着99%的时间电网都有闲置的电力。 但它们必须在那闲置,以防万一。
我的想法是:我们能否达成协议并设计一种架构,使得当社会基础设施需要最大电力时,数据中心可以少用电? 那本来就是极少数情况。在那段时间里,我们可以用备用发电机,或者让计算机将工作负载转移到其他地方,或者干脆让计算机运行得慢一点。

Lex Fridman:障碍是什么?监管?
黄仁勋:这是一个三方问题。首先,终端客户要求数据中心永远不掉线,追求极致完美。需要让客户意识到他们在要求什么。其次,我们要建造能“优雅降级”的数据中心。第三,公用事业公司需要意识到这是一个机会,可以提供不同等级的供电承诺。现在的电网里有太多浪费了。
对马斯克的看法:极致的系统简化
Lex Fridman:你赞扬了埃隆·马斯克在四个月内建成Colossus超级计算机。他的工程方法有哪些值得学习?
黄仁勋:首先,埃隆是一个顶级的系统思想家。他能把一切精简到极致,剔除所有不必要的环节,但保留产品的核心功能。 他是你能想象到的最极致的极简主义者。另外,我非常欣赏他总是出现在行动的第一线。当你亲自展现出这种迫切感时,会带动所有人。
以物理极限为基准,去除冗余复杂
Lex Fridman:英伟达的“极致协同设计”与埃隆的方法有何相似?
黄仁勋:协同设计是终极的系统工程问题。我们有一种理念叫“光速”。“光速”不只是指速度,它是我的速记法,意指“物理学所能达到的极限”。 我们做任何事都会与“光速”对比:内存速度、计算速度、功耗、成本。我强迫每个人在动手前先思考第一性原理和物理极限。
我不喜欢“持续改进”这种说法。我更喜欢从第一性原理出发。如果做一件事要74天,我宁愿全部推倒归零,问:“如果我从头开始建,最快能有多快?”通常你会发现可能只需要6天。一旦你知道6天是有可能的,那么讨论会变得高效得多。
Lex Fridman:考虑到系统如此复杂,“简洁”还是可能的吗?
黄仁勋:我最常说的一句话是:我们需要事物“在必要时足够复杂,在可能时足够简单”。问题在于,所有的复杂性都是必要的吗?我们必须对此进行测试和挑战,除此之外的任何复杂性都是多余的。
AGI 已经实现?
Lex Fridman:关于AGI的时间线,如果定义为:一个AI系统能做你的工作——即创立并经营一家价值超过10亿美元的技术公司。这离我们有多远?
黄仁勋:我认为就是现在。我们已经实现了这种意义上的AGI。

Lex Fridman:你觉得现在就能有AI经营的公司?
黄仁勋:可能的。一个Claw也许能创建一个有趣的网页服务或应用,突然间几十亿人每人付50美分,随后它可能很快倒闭。互联网时代有很多这类公司,那时的网站并不比现在OpenClaw能生成的更复杂。实现病毒式传播并变现,这是可能的。这正在发生,在中国你会看到很多人让Claw去找工作、赚钱。
未来编程人数将达10亿,本质工作不会消失
黄仁勋:但我想强调一点,人们非常担心自己的工作。我想提醒大家,你的工作目标和你使用的工具是两回事。我当了34年CEO,我的工具一直在变。
曾经预言第一个消失的职业是放射科医生,因为计算机视觉会超越人类。现在放射平台都由AI驱动,但放射科医生的数量反而增加了。为什么?因为现在研究影像扫描的速度大幅提升,可以处理更多片子,诊断得更准确,医院赚了更多钱,自然需要更多放射科医生。危言耸听的警告做得太过头了。
同样,英伟达的软件工程师数量也会增加,而不是减少。软件工程师的目标是解决问题,我不在乎他们写了多少行代码。解决问题、团队协作、评估结果、寻找新挑战、创新、串联灵感,这些本质工作永远不会消失。
Lex Fridman:你认为全世界程序员的数量可能会增加?
黄仁勋:是的。因为“编程”的定义正在改变。现在的编程仅仅是“设定规范”,甚至只是给出软件架构。那么,有多少人能做到这一点?告诉计算机去构建什么,全球能做到这一点的人数将从3000万增加到10亿。 未来的每个木匠都会是程序员,而且是带着AI的建筑师。会计师也会变成财务分析师和顾问。
Lex Fridman:但现在很多白领确实对失业感到焦虑。
黄仁勋:我处理焦虑的方法就是将其分解。如果你的工作仅仅是一项“任务”,那你确实会被取代;但如果你的职业目标包含这些任务,那就必须用AI自动化它们。如果我现在招聘应届生,在“不懂AI”和“AI专家”之间,我肯定雇后者。无论是会计、营销、律师还是木匠,去使用AI吧。
人性比智能更宏大
Lex Fridman:你认为人类本性中,是否有某些东西是芯片永远无法复制的?
黄仁勋:我不确定芯片是否会“紧张”。AI也许能识别和理解情绪,但芯片本身不会感受到。人类在相同环境下因为情感起伏而产生的差异化表现,是构建AI时没见过的。
Lex Fridman:主观体验非常特别。
黄仁勋:区分“智能”和“人性”很重要。智能是感知、理解、推理和计划的闭环,它不等于人性。我认为智能将成为一种“商品”。智能是功能性的,而人性包含痛苦、意志和更广阔的意义。我们应该抬高“人性”的地位,而非智能。
Lex Fridman:英伟达的成功依赖于你。你会思考死亡吗?
黄仁勋:我真的不想死。我有美好的生活和极具意义的工作。关于接班人计划,我常说我不相信它。原因不是我长生不老,而是如果你担心未来,最该做的是持续传递知识和见解。我学到的任何东西都不会在桌上停留超过一秒,我会立刻分享出去。 我希望我能死在工作岗位上。
Lex Fridman:是什么让你对人类的未来保持希望?
黄仁勋:我始终对人类的善良和同理心充满信心。我总是预设人们想要做好事、想帮助他人,而事实证明我是对的。我们可以合理地期待疾病的终结、污染的减少。
这场对话揭示了黄仁勋如何将深刻的逻辑推理转化为坚定的战略行动,并塑造了整个AI产业的走向。从断言AGI已成现实,到预言编程人群将扩大至10亿,他的观点无疑将为技术圈的思考提供重要燃料。关于人工智能的演进与影响,更多深度讨论欢迎在云栈社区的技术板块进行。同时,技术领袖们的这些前瞻性洞见与战略思考,也正是开发者广场乐于探讨的极客话题。