云栈社区»论坛 › 回收站「 Recycle Bin 」 › 从AlphaGo到Gemini 3：揭秘哈萨比斯如何带领谷歌DeepMind逆袭Ope ...

发回帖发新帖

3702 积分	0 好友	492 主题

发消息

从AlphaGo到Gemini 3：揭秘哈萨比斯如何带领谷歌DeepMind逆袭OpenAI

发表于 2026-3-29 01:38:54 | 查看: 72| 回复: 0

《哈萨比斯：谷歌AI之脑》书籍封面图

谷歌与OpenAI围绕人工智能的全方位角逐，无疑是硅谷乃至全球AI行业最关键的竞争之一。回顾过去几年，OpenAI凭借GPT系列模型曾长期领先，但去年底，随着谷歌发布Gemini 3，这场竞赛迎来了一个标志性的转折点——谷歌DeepMind首次实现了对OpenAI的追赶甚至部分超越。

谷歌AI部门的核心是DeepMind，而它的掌舵人是德米斯·哈萨比斯。他的人生履历堪称传奇：带有华人血统、曾在剑桥大学求学、在追求AGI（通用人工智能）的途中顺手拿下了诺贝尔化学奖。1976年出生于伦敦普通家庭的他，在母亲的培养下，很早就展现出惊人的天赋。他4岁学棋，9岁成为英国11岁以下国际象棋队队长，13岁已是全球同年龄段排名第二的国际象棋大师。

16岁，哈萨比斯被剑桥大学计算机科学专业录取。随后的学生时代，他在学术界和企业界之间穿梭，不断探索新技术。正是在电子游戏开发的经历中，他捕捉到了一个激动人心的想法：能否让游戏中的角色和物体拥有自主意识般行动？这个理念与今天的AI智能体不谋而合，也让他逐渐看清了通往AGI的未来之路。

2010年，哈萨比斯与伙伴共同创立DeepMind，使命是“先解决智能问题，再用它解决其他一切问题”。尽管埃隆·马斯克是早期投资人，但哈萨比斯最终在2014年选择以4亿美元的价格将DeepMind卖给谷歌。打动他的关键，是谷歌联合创始人拉里·佩奇和谢尔盖·布林对前沿科技的远见与志趣。

在谷歌的庇护下，哈萨比斯带领DeepMind创造了震惊世界的AlphaGo，击败了包括李世石、柯洁在内的顶尖围棋高手。随后推出的AlphaFold系统，成功预测了蛋白质结构，这一贡献直接为哈萨比斯赢得了诺贝尔化学奖，将他推向了科学荣誉的顶峰。

然而，当AI大模型的时代浪潮汹涌而来时，哈萨比斯和DeepMind却一度失速了。为了实现AGI，他执着于在计算机中模拟整个真实世界，启动了名为“盖亚”的项目。这个耗资巨大的强化学习试验场，运行两三年后因难以产出实际成果而陷入困境。与此同时，萨姆·奥特曼领导的OpenAI沿着大语言模型的技术路线一路狂奔，成为新时代的第一个赢家。

据说，哈萨比斯并不欣赏奥特曼，他认为后者追求权力，而自己追求的是知识与科学。但道德评判无法取代产品的正面较量，DeepMind必须奋起直追。

大约在2019年前后，DeepMind开始发力大语言模型。在追赶的上半场，OpenAI总是领先至少一个身位。但到了2025年，局势开始扭转。年底发布的Gemini 3，让DeepMind终于在部分核心指标上追平甚至超越了OpenAI的最新模型。

今年2月，美国知名作家塞巴斯蒂安·马拉比在达沃斯见到了哈萨比斯。马拉比回忆道：“我问他近况如何，他说：‘Gemini现在领先了。’说这话时，他脸上的笑容根本藏不住。”

这段不可思议的逆袭是如何完成的？哈萨比斯本人究竟扮演了怎样的角色？

马拉比历时三年，与哈萨比斯累计交流超过30小时，并访谈了其身边上百位相关人士，最终写成了《哈萨比斯：谷歌AI之脑》一书，首次披露了大量幕后细节。近日，这本书被引进国内，由未尽研究创始人、资深媒体人周健工翻译。周健工也是中国最早面对面采访哈萨比斯的媒体人之一，我们与他进行了一场深度对谈，探讨了书中的精彩故事与更多未曾公开的幕后。

《哈萨比斯：谷歌AI之脑》译者周健工

问：哈萨比斯具有华人渊源。与另一位华人企业家黄仁勋相比，您觉得两人最根本的差异在哪里？

周健工：哈萨比斯本质上是一位科学家和创新者，而黄仁勋的底色更像是一位工程师和企业家，这是两人最基本的不同。

哈萨比斯提出AGI构想时，他的眼光远远超越了自己的时代。在剑桥读书期间，AGI的念头就已在他脑海中萌芽。当年他在伦敦讲述AGI故事时，几乎没人相信，即便在硅谷，信者也是极少数。所以，他是一个超越时代的人。

而且他不是空想的科学家，而是想到就要做到。他早期创业做游戏，并非为了游戏本身，而是将其当作一个AI实验室。在这一点上，黄仁勋创业时也有他的愿景，但愿景并未超越他所在的时代。他或许能抓住某个技术浪潮，但并非超越时代。他是被技术浪潮推着向前走，从显卡到并行计算，再到GPU，然后GPU规模越来越大，最终构建起整个AI加速计算的基础设施。

哈萨比斯的愿景可能领先时代十年、二十年甚至三十年，他在为理想奋斗。黄仁勋则在技术和工程上有其远见，但他基本上是顺应并推动一个又一个技术浪潮前行，我认为这是非常不同的。

此外，哈萨比斯虽有两次创业经历，但从未经营过以盈利为首要目的的公司，他更多是一位科学家。但他又不是普通的科学家，而是一个真正的创新者，他没有待在学术机构里空想AGI，而是试图将其实现。他是“科学家+创新者”的复合体。

黄仁勋在企业战略、管理、研发、工程甚至营销方面，是一位极其卓越的企业家，这又是哈萨比斯远远不及的。

问：2017年，您曾与哈萨比斯有一次面对面的交流。现在近十年过去，通过翻译这本书，您对哈萨比斯的认知发生了哪些变化？

周健工：其实很多东西没有改变。比如他的核心使命——“先解决AI，再用AI解决一切”——自始至终都没有动摇。他对AGI的信念也没有改变，始终坚信AI应用于科学发现、造福人类。

同时，他的研究方式也没有变——高密度的人才组织形式，从全球招募最优秀的人才进行跨学科研究。我当年采访他时，DeepMind约有四五百人，顶尖人才来自全球60多个国家，这种模式至今仍是DeepMind的底色。他找的都是跨学科的研究者。

还有，他始终坚持扎根伦敦。即使被谷歌收购，即使后来DeepMind与谷歌大脑合并，他的大本营依然在伦敦。

当然，变化也是显著的。他现在领导的DeepMind规模已达六七千人，比当年大了十倍不止。他以前是较为纯粹的科学家型创新者，但现在必须面对从研究到工程、从学术到商业、从发表论文到产品竞争的复杂挑战。他也展现出了此前未曾显露的强大领导力。

当年与哈萨比斯交流时，他强调DeepMind在谷歌“AI First”战略中起到引领和旗帜作用。我曾问时任谷歌CEO埃里克·施密特，DeepMind在谷歌内究竟扮演什么角色，难道只是收购了一个实验室？施密特只回了一个词——Marketing（营销）。

当时，DeepMind并未直接为谷歌创造显著的商业价值，但它对于提升谷歌的声誉、推动公司向AI转型的战略、以及吸引全球顶尖AI人才，发挥了巨大作用。

问：在谷歌内部，DeepMind与产品线的融合似乎并不紧密。回过头看，这种相对独立的定位，是否还能适应当下激烈的竞争环境？

周健工：哈萨比斯对自己的定位是准确且符合实际的。DeepMind毕竟是谷歌旗下的一家公司。谷歌赋予它的核心使命，就是从零到一的突破性研究，在追求AGI的道路上，在算法和架构的科研前沿不断取得突破。

至于如何将研究成果规模化，如何与谷歌庞大的生态系统结合，这并非DeepMind最主要的任务。他首先将自己定位为科学家是对的，因为科学家是发现与创新之源。

谷歌对哈萨比斯最大的期待，就是在大模型的研发竞赛中，能够翻盘OpenAI。如今Anthropic势头也很猛，还要面对中国开源模型的挑战，如何保持模型领先性，我认为这是对哈萨比斯和DeepMind最重要的期待。至于赚多少钱，或者将技术应用于搜索、邮箱等具体产品，甚至打造杀手级应用，反而不是他最核心的问题。

问：哈萨比斯早年在游戏行业的经历，对他后来从事AI研究产生了哪些直接影响？

周健工：在剑桥读书期间，他就曾在游戏公司“牛蛙”实验室打工。那段经历让他尝试了许多创新。书中有几个有意思的故事，例如他们会设计大量游戏角色与环境的互动，这些互动与反馈机制，其实就是智能体概念的雏形。

有一个情节特别有趣。他的老板（彼得·莫里纽克斯）曾带他去AI研究的重镇——卡内基梅隆大学，与那里的AI教授交流。教授们当时提出了一些理论化、抽象化的AI智能体概念。哈萨比斯听完立刻觉得：“你们在讲的东西，我已经开始在做了。”这给了他巨大的信心。

离开剑桥时，AGI的概念已在他脑中基本成型。后来他创办了“万灵药”工作室，开发了一款名为《共和国》的极其复杂的游戏。早在1999年，他就想渲染出机器螺丝的纹理、台阶上的苔藓纹理，并刻画上千个独立角色形象，试图让游戏从“有限状态”进入“无限状态”。但这些设想远远超越了当时的技术水平，因为算力根本不够。

他们在美国博览会上演示这款游戏时，偷偷给电脑加了八倍显卡，但演示时还是崩溃了。这说明，他的游戏理念超前于时代的技术基础。我相信这段经历，也让他未来在追求AGI时更能脚踏实地。

无论是在游戏公司打工还是创业，都证明了他是一位“知行合一”的科学家。他研究AGI，并非困于学术象牙塔，而是为其寻找实验场，而最初的实验场就是游戏。

问：2019年，OpenAI的一位高管曾向哈萨比斯提议，如果任何一方接近AGI，双方可以考虑合作，但被哈萨比斯拒绝了。您如何看待他这个选择？

周健工：我认为合作在当时是不可能的。

首先，哈萨比斯当时坚信AGI只能通过强化学习路径实现，再结合神经网络（因为他研究生物神经计算）。而OpenAI主要走的是深度学习（尤其是大语言模型）的道路。技术路线存在根本分歧。

其次，哈萨比斯内心有其孤傲的一面。直到那个时候，他内心仍视OpenAI为自己的追随者和模仿者，自然不屑于合作。

事实上，当时的AI研究圈子在学术层面还是比较开放的。无论是DeepMind还是谷歌大脑，包括那篇著名的Transformer论文，研究成果都会迅速公开。在研究层面合作空间不大，主要是在工程化和产品化的实践上，双方后来才逐渐拉开了差距。

问：DeepMind之前为实现AGI，启动了“盖亚”项目，试图在计算机中模拟真实世界来训练AI。这个项目为何后来难以为继？

周健工：可以这样理解。在“盖亚”项目启动时，AlphaGo已经攻克了围棋，DeepMind觉得自己在游戏这个AGI“试验场”取得了辉煌胜利。他们必然会寻找下一个目标，因为游戏环境终究有其局限性。

围棋棋盘有361个格点，边界清晰，规则明确。而自然界是连续的、复杂的、模糊的、高维的，与游戏环境截然不同。要真正证明自己是AGI，必须将其置于更接近真实自然的环境中进行验证。因此他们想到了“盖亚”项目。

这个项目在当时推进了两三年，并不成功，即使放到今天实现起来仍非常困难。这是一个极度超前的项目，在学术探索上绝对有价值，但DeepMind的目标从来不只是发论文，而是做出实实在在的成果。他们一直未能将其“做出来”，虽然探索很有价值，但也确实过于超前。

问：几年前谷歌收购DeepMind时，有多家公司参与竞购，包括扎克伯格，但哈萨比斯最终选择了谷歌。在您看来，当时他最看重谷歌的是什么？

周健工：首先，谷歌是当时最成功、实力最雄厚的互联网公司之一，资金充沛。

第二，谷歌作为一家搜索公司，是所有互联网公司中对AI最有远见、也最重视AGI的，这一点深得哈萨比斯之心。

第三，谷歌的文化契合。他认为谷歌的两位创始人谢尔盖·布林和拉里·佩奇身上带有科学家气质（都是斯坦福博士）。他们对科学探索有长线布局，比如谷歌X实验室涉足众多前沿领域。他们能将DeepMind定位为一个探索未来的机构，谷歌容得下这样的梦想。

此外，谷歌对AI技术的伦理和安全有较早的意识，其“不作恶”的价值观（至少在当年）与哈萨比斯的理念有相通之处。所以，谷歌从一开始就是他的首选。

过程中，马斯克也想收购。但哈萨比斯很清楚马斯克当时实力不足，且有其私心。马斯克谈论的是探索外太空、星际移民，哈萨比斯则认为这与专注实现AGI不是一回事，他不想成为别人宏大叙事的工具。

扎克伯格也接触过，但聊完后，哈萨比斯觉得扎克伯格对AGI的理解远不如谷歌深刻。

最后，一个决定性的时刻是，拉里·佩奇在一次散步时对他说：“你的目标不是想研究AGI吗？那你为什么不来谷歌？我这里已经为你准备好了一切。”这句话彻底打动并说服了他。

问：DeepMind被谷歌收购后，在大语言模型时代初期反而被OpenAI甩开。哈萨比斯在战略上是否存在误判？

周健工：进入谷歌后，资源（人力、算力、资金）变得极其丰富，他们同时探索多条技术路线，这本身是正常的。

但哈萨比斯本人在那个阶段的战略判断上，确实出现了偏差，或者说失误。他当时并不重视大语言模型。他曾在内部将研究布局分为三块：第一是强化学习（被他置于首位），第二是神经网络，第三是基于数据的归纳推理等。而语言，只被他视为第三块中的一个分支。由此可见，他战略上并未将大语言模型放在核心位置。

他更笃信强化学习的路径。另一方面，他认为语言数据过于抽象、“不接地气”。但他低估了移动互联网发展所积累的海量语言数据的价值，以及当时GPU算力突飞猛进之下，两者结合可能带来的突破。

他真正开始重视，是在GPT-2发布之后。当行业都在讨论OpenAI正在研发参数量高达1750亿的GPT-3时，DeepMind才开始全力追赶，但此时已经有些晚了。

当时DeepMind在研发一个基于Chinchilla的700亿参数模型“麻雀”（Sparrow），采用了当时最先进的缩放定律方法。与此同时，谷歌大脑也在研发多个模型，如Gopher、LaMDA、PaLM等，最大的参数量达到四五千亿。谷歌当时认为，这样足以超越GPT-3了。但他们没想到，OpenAI中间杀出了一个GPT-3.5（即ChatGPT背后的模型）。

更关键的是，到2022年夏天，GPT-4的预训练已基本完成，参数量接近2万亿。当你还在盯着GPT-3奋力追赶时，对手已经快把下一代产品做好了，这完全陷入了被动挨打的局面。

问：DeepMind被收购几年后，与谷歌总部的关系一度出现裂痕。您认为主要原因是什么？哈萨比斯在其中起到了什么作用？

周健工：这更像是一种特殊情境下的博弈，很难说是直接的冲突。哈萨比斯本人并非想挑起与谷歌的冲突。

谷歌对DeepMind始终非常重视，给予了全力的算力倾斜。DeepMind进行大量超前研究，需要耗费巨量算力进行反复实验和训练，其中包含许多失败的模型。其算力消耗一度比服务全球几十亿用户的Gmail还要多。

之所以出现博弈，是因为当时谷歌母公司Alphabet正在进行架构调整，希望将一些长期投入、暂未盈利的项目分拆出去，以便外部融资。DeepMind恰好处于这个位置上。

哈萨比斯团队内部本能地开始思考：是否要分拆出去？分拆后怎么办？联合创始人穆斯塔法·苏莱曼想得更多，认为这是一个独立的机会，甚至开始接触外部投资人，如蔡崇信、LinkedIn创始人雷德·霍夫曼（后者曾承诺投资10亿美元）。

谷歌高层对此想法也不尽一致。拉里·佩奇曾表示，如果DeepMind愿意分拆，可以给予资金支持继续研究。但新任谷歌CEO桑达尔·皮查伊的想法不同。

上层意见不一，下面的人自然要为自己的出路做打算，于是出现了所谓的“马里奥计划”（即与母公司博弈、寻求分拆的方案）。最终，皮查伊拍板决定不能分拆。谷歌以战略眼光认定，DeepMind所研究的AGI将决定公司的未来。从这一点看，谷歌始终对哈萨比斯抱有信心。

从某种意义上说，DeepMind与谷歌的关系最终得到了理顺。虽然大公司在工程和产品化速度上可能不如初创公司灵活，但谷歌强大的研究能力和在基础设施（如TPU芯片）上的长期投入，为DeepMind提供了坚实的基础。

因此，哈萨比斯本人在大规模工程部署、商业竞争和产品开发方面的能力，也是在谷歌这个平台上得以成长和放大的。这是一个相互成就的过程。

问：DeepMind从GPT-3时代就开始追赶，但直到去年之前，Gemini相比OpenAI仍有差距。在那些年，DeepMind屡战屡败的主要原因是什么？

周健工：首先，技术节奏上就慢了一到两拍。当OpenAI发布ChatGPT（基于GPT-3.5）时，GPT-4的预训练已经完成。第二年3月，GPT-4完成后续训练并发布。而DeepMind和谷歌大脑当时的模型，大多还瞄准着GPT-3进行对标。当GPT-4横空出世时，技术上确实落后了一代。

第二，ChatGPT是硅谷历史上最成功的科技产品之一，它迅速占领了全球用户的心智。AI发展了70年，但此前始终局限于象牙塔内的小圈子。ChatGPT的出现，让AI第一次真正进入主流大众的视野。直到今天，“ChatGPT”几乎成了AI的代名词，其周活用户已近9亿，今年破10亿毫无悬念。即便Gemini在规模和性能榜上实现超越，但作为一个独立的AI应用，其用户心智占有率仍难以匹敌。

第三，大公司病在当时暴露无遗。特别是当Meta的开源模型Llama推出后，对整个行业造成了巨大冲击。谷歌内部甚至流传出一句震惊行业的话：“大模型根本没有护城河。” Llama的发布让谷歌内部一度陷入混乱和危机感，连已处于半退休状态的创始人都被惊动，回到办公室坐镇。

第四，DeepMind自身的架构调整需要一个适应过程。中间经历了Bard模型灾难性的发布事件。最终，谷歌决定将谷歌大脑与DeepMind合并，由哈萨比斯统一领导，并集全公司之力打造统一的大模型品牌Gemini。这个合并与调整的过程，本身就耗费了半年左右的时间。

统一指挥后，团队才能心无旁骛地专注于Gemini的开发，直到2025年底才初步实现翻盘。

问：在这次逆袭过程中，相比DeepMind早期的成功，您认为主要的关键成功因素有哪些？

周健工：哈萨比斯一旦下定决心要赢得一场竞争，他是非常善于达成目标的。历史证明，只要给他足够的时间和资源，他想做的事情基本都能做成。

我认为很关键的一点，是谷歌强大的基础设施保障。整个TPU架构在模型训练和推理方面提供了持续的支撑。这不光是算力充足的问题，更是软硬件的深度协同。如何让新的TPU架构适配新模型，如何通过硬件实现下一步的技术亮点，如何从算力架构中最高效地“榨取”性能，这些都至关重要。最终，最强的Gemini 3大模型正是由TPU而非GPU训练出来的。

另外，谷歌的人才队伍相对稳定，资金供给也持续稳定。不像OpenAI，需要不断融资来支撑其庞大的开销和基础设施自建。DeepMind没有这些后顾之忧，可以专心致志地把Gemini大模型做好。无论是在原生多模态、长上下文理解、持续学习，还是世界模型等前沿方向的探索上，他们都可以心无旁骛。这些本来就是他们擅长的研究领域，专注让他们得以发挥出固有优势。

问：在这个过程中，哈萨比斯个人起到了什么样的核心作用？

周健工：他是整个谷歌AI的代言人，是谷歌AI战略的灵魂人物。

尤其是在获得诺贝尔奖之后，他对AI发展方向的观点更容易获得公众和业界的信任。他作为科学家的身份，以及将AI用于生物科技、药物发现等关乎人类福祉的领域的愿景，为谷歌AI建立了极强的可信度。

但另一方面，哈萨比斯对量子计算持怀疑态度。他认为基于图灵机的经典计算足以解决AGI所需的基本计算问题。而谷歌对量子计算非常重视，皮查伊近期还高调宣布量子计算可能在近几年取得重大突破。如果哈萨比斯不相信或质疑量子计算的作用，那么他未来能否在DeepMind的架构内包容乃至引领量子计算与AI的结合，这将是一个值得关注的潜在影响因素。

问：您认为现在的哈萨比斯，是一位合格的企业家吗？

周健工：我觉得哈萨比斯重新定义了什么是“科学研究的创新者”。这个评价一点也不比“企业家”低，他改变了许多进行科学研究的方法和范式。

当年采访他时，我曾非常好奇地问他：你整天做这些研究，但作为初创公司，投资人难道只看你发论文吗？

他的回答是，最初的想法就是用AI去发现和理解宇宙，解释周围环境的结构和底层运作逻辑。他说：“我无法超越费曼，无法超越爱因斯坦，但我要发明的AI将来能够超越费曼，超越爱因斯坦。”

他的做法，是通过创业的方式来实现科研突破。他最初非常讨厌学术机构的官僚气息和缺乏紧迫感的“散养”状态。他认为那种各自为政、零散发论文的模式，无法实现AGI这样的宏大目标。

因为哈萨比斯对自己怀有强烈的使命感，要用一生的时间去实现AGI。这种用创业的心态去做科研，用AI推动科学突破的模式，改变了整个科学研究的范式。

我认为，他甚至比作为一个单纯的企业家意义更为重大。如果想了解更多关于此类科技趋势与极客文化的讨论，欢迎来云栈社区的开发者广场交流。

问：长远来看，哈萨比斯仍是带领DeepMind继续前进的最合适人选吗？

周健工：哈萨比斯为自己设定的终极目标是实现AGI，而不是在谷歌内部谋求某个高级管理职位（比如取代皮查伊成为谷歌CEO）。尽管外界有过此类猜测，但我认为这既非他的兴趣所在，也非他最擅长的领域。

我觉得哈萨比斯唯一的目标就是实现AGI。他自己曾说，大概还需要五到十年时间，可能还缺一两个“Transformer级别”的重大创新。他依然认为在谷歌DeepMind这个平台上继续努力，是实现目标的最佳途径。至少在未来的三到五年内，我认为情况依然如此。

上一篇：耳机磁场或加剧空气磁性纳米颗粒脑内蓄积，研究揭示神经毒性风险
下一篇：AI战略定成败：大厂“增效”思维暴露转型困局，快手260亿投资难挽股价颓势

DeepMind, 谷歌, AGI, 大语言模型, 人工智能竞争

从AlphaGo到Gemini 3：揭秘哈萨比斯如何带领谷歌DeepMind逆袭OpenAI

相关帖子