找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2753

积分

0

好友

371

主题
发表于 4 小时前 | 查看: 3| 回复: 0

《哈萨比斯:谷歌AI之脑》书籍封面图

谷歌与OpenAI围绕人工智能的全方位角逐,无疑是硅谷乃至全球AI行业最关键的竞争之一。回顾过去几年,OpenAI凭借GPT系列模型曾长期领先,但去年底,随着谷歌发布Gemini 3,这场竞赛迎来了一个标志性的转折点——谷歌DeepMind首次实现了对OpenAI的追赶甚至部分超越。

谷歌AI部门的核心是DeepMind,而它的掌舵人是德米斯·哈萨比斯。他的人生履历堪称传奇:带有华人血统、曾在剑桥大学求学、在追求AGI(通用人工智能)的途中顺手拿下了诺贝尔化学奖。1976年出生于伦敦普通家庭的他,在母亲的培养下,很早就展现出惊人的天赋。他4岁学棋,9岁成为英国11岁以下国际象棋队队长,13岁已是全球同年龄段排名第二的国际象棋大师。

16岁,哈萨比斯被剑桥大学计算机科学专业录取。随后的学生时代,他在学术界和企业界之间穿梭,不断探索新技术。正是在电子游戏开发的经历中,他捕捉到了一个激动人心的想法:能否让游戏中的角色和物体拥有自主意识般行动?这个理念与今天的AI智能体不谋而合,也让他逐渐看清了通往AGI的未来之路。

2010年,哈萨比斯与伙伴共同创立DeepMind,使命是“先解决智能问题,再用它解决其他一切问题”。尽管埃隆·马斯克是早期投资人,但哈萨比斯最终在2014年选择以4亿美元的价格将DeepMind卖给谷歌。打动他的关键,是谷歌联合创始人拉里·佩奇和谢尔盖·布林对前沿科技的远见与志趣。

在谷歌的庇护下,哈萨比斯带领DeepMind创造了震惊世界的AlphaGo,击败了包括李世石、柯洁在内的顶尖围棋高手。随后推出的AlphaFold系统,成功预测了蛋白质结构,这一贡献直接为哈萨比斯赢得了诺贝尔化学奖,将他推向了科学荣誉的顶峰。

然而,当AI大模型的时代浪潮汹涌而来时,哈萨比斯和DeepMind却一度失速了。为了实现AGI,他执着于在计算机中模拟整个真实世界,启动了名为“盖亚”的项目。这个耗资巨大的强化学习试验场,运行两三年后因难以产出实际成果而陷入困境。与此同时,萨姆·奥特曼领导的OpenAI沿着大语言模型的技术路线一路狂奔,成为新时代的第一个赢家。

据说,哈萨比斯并不欣赏奥特曼,他认为后者追求权力,而自己追求的是知识与科学。但道德评判无法取代产品的正面较量,DeepMind必须奋起直追。

大约在2019年前后,DeepMind开始发力大语言模型。在追赶的上半场,OpenAI总是领先至少一个身位。但到了2025年,局势开始扭转。年底发布的Gemini 3,让DeepMind终于在部分核心指标上追平甚至超越了OpenAI的最新模型。

今年2月,美国知名作家塞巴斯蒂安·马拉比在达沃斯见到了哈萨比斯。马拉比回忆道:“我问他近况如何,他说:‘Gemini现在领先了。’说这话时,他脸上的笑容根本藏不住。”

这段不可思议的逆袭是如何完成的?哈萨比斯本人究竟扮演了怎样的角色?

马拉比历时三年,与哈萨比斯累计交流超过30小时,并访谈了其身边上百位相关人士,最终写成了《哈萨比斯:谷歌AI之脑》一书,首次披露了大量幕后细节。近日,这本书被引进国内,由未尽研究创始人、资深媒体人周健工翻译。周健工也是中国最早面对面采访哈萨比斯的媒体人之一,我们与他进行了一场深度对谈,探讨了书中的精彩故事与更多未曾公开的幕后。

《哈萨比斯:谷歌AI之脑》译者周健工

问:哈萨比斯具有华人渊源。与另一位华人企业家黄仁勋相比,您觉得两人最根本的差异在哪里?

周健工:哈萨比斯本质上是一位科学家和创新者,而黄仁勋的底色更像是一位工程师和企业家,这是两人最基本的不同。

哈萨比斯提出AGI构想时,他的眼光远远超越了自己的时代。在剑桥读书期间,AGI的念头就已在他脑海中萌芽。当年他在伦敦讲述AGI故事时,几乎没人相信,即便在硅谷,信者也是极少数。所以,他是一个超越时代的人。

而且他不是空想的科学家,而是想到就要做到。他早期创业做游戏,并非为了游戏本身,而是将其当作一个AI实验室。在这一点上,黄仁勋创业时也有他的愿景,但愿景并未超越他所在的时代。他或许能抓住某个技术浪潮,但并非超越时代。他是被技术浪潮推着向前走,从显卡到并行计算,再到GPU,然后GPU规模越来越大,最终构建起整个AI加速计算的基础设施。

哈萨比斯的愿景可能领先时代十年、二十年甚至三十年,他在为理想奋斗。黄仁勋则在技术和工程上有其远见,但他基本上是顺应并推动一个又一个技术浪潮前行,我认为这是非常不同的。

此外,哈萨比斯虽有两次创业经历,但从未经营过以盈利为首要目的的公司,他更多是一位科学家。但他又不是普通的科学家,而是一个真正的创新者,他没有待在学术机构里空想AGI,而是试图将其实现。他是“科学家+创新者”的复合体。

黄仁勋在企业战略、管理、研发、工程甚至营销方面,是一位极其卓越的企业家,这又是哈萨比斯远远不及的。

问:2017年,您曾与哈萨比斯有一次面对面的交流。现在近十年过去,通过翻译这本书,您对哈萨比斯的认知发生了哪些变化?

周健工:其实很多东西没有改变。比如他的核心使命——“先解决AI,再用AI解决一切”——自始至终都没有动摇。他对AGI的信念也没有改变,始终坚信AI应用于科学发现、造福人类。

同时,他的研究方式也没有变——高密度的人才组织形式,从全球招募最优秀的人才进行跨学科研究。我当年采访他时,DeepMind约有四五百人,顶尖人才来自全球60多个国家,这种模式至今仍是DeepMind的底色。他找的都是跨学科的研究者。

还有,他始终坚持扎根伦敦。即使被谷歌收购,即使后来DeepMind与谷歌大脑合并,他的大本营依然在伦敦。

当然,变化也是显著的。他现在领导的DeepMind规模已达六七千人,比当年大了十倍不止。他以前是较为纯粹的科学家型创新者,但现在必须面对从研究到工程、从学术到商业、从发表论文到产品竞争的复杂挑战。他也展现出了此前未曾显露的强大领导力。

当年与哈萨比斯交流时,他强调DeepMind在谷歌“AI First”战略中起到引领和旗帜作用。我曾问时任谷歌CEO埃里克·施密特,DeepMind在谷歌内究竟扮演什么角色,难道只是收购了一个实验室?施密特只回了一个词——Marketing(营销)。

当时,DeepMind并未直接为谷歌创造显著的商业价值,但它对于提升谷歌的声誉、推动公司向AI转型的战略、以及吸引全球顶尖AI人才,发挥了巨大作用。

问:在谷歌内部,DeepMind与产品线的融合似乎并不紧密。回过头看,这种相对独立的定位,是否还能适应当下激烈的竞争环境?

周健工:哈萨比斯对自己的定位是准确且符合实际的。DeepMind毕竟是谷歌旗下的一家公司。谷歌赋予它的核心使命,就是从零到一的突破性研究,在追求AGI的道路上,在算法和架构的科研前沿不断取得突破。

至于如何将研究成果规模化,如何与谷歌庞大的生态系统结合,这并非DeepMind最主要的任务。他首先将自己定位为科学家是对的,因为科学家是发现与创新之源。

谷歌对哈萨比斯最大的期待,就是在大模型的研发竞赛中,能够翻盘OpenAI。如今Anthropic势头也很猛,还要面对中国开源模型的挑战,如何保持模型领先性,我认为这是对哈萨比斯和DeepMind最重要的期待。至于赚多少钱,或者将技术应用于搜索、邮箱等具体产品,甚至打造杀手级应用,反而不是他最核心的问题。

问:哈萨比斯早年在游戏行业的经历,对他后来从事AI研究产生了哪些直接影响?

周健工:在剑桥读书期间,他就曾在游戏公司“牛蛙”实验室打工。那段经历让他尝试了许多创新。书中有几个有意思的故事,例如他们会设计大量游戏角色与环境的互动,这些互动与反馈机制,其实就是智能体概念的雏形。

有一个情节特别有趣。他的老板(彼得·莫里纽克斯)曾带他去AI研究的重镇——卡内基梅隆大学,与那里的AI教授交流。教授们当时提出了一些理论化、抽象化的AI智能体概念。哈萨比斯听完立刻觉得:“你们在讲的东西,我已经开始在做了。”这给了他巨大的信心。

离开剑桥时,AGI的概念已在他脑中基本成型。后来他创办了“万灵药”工作室,开发了一款名为《共和国》的极其复杂的游戏。早在1999年,他就想渲染出机器螺丝的纹理、台阶上的苔藓纹理,并刻画上千个独立角色形象,试图让游戏从“有限状态”进入“无限状态”。但这些设想远远超越了当时的技术水平,因为算力根本不够。

他们在美国博览会上演示这款游戏时,偷偷给电脑加了八倍显卡,但演示时还是崩溃了。这说明,他的游戏理念超前于时代的技术基础。我相信这段经历,也让他未来在追求AGI时更能脚踏实地。

无论是在游戏公司打工还是创业,都证明了他是一位“知行合一”的科学家。他研究AGI,并非困于学术象牙塔,而是为其寻找实验场,而最初的实验场就是游戏。

问:2019年,OpenAI的一位高管曾向哈萨比斯提议,如果任何一方接近AGI,双方可以考虑合作,但被哈萨比斯拒绝了。您如何看待他这个选择?

周健工:我认为合作在当时是不可能的。

首先,哈萨比斯当时坚信AGI只能通过强化学习路径实现,再结合神经网络(因为他研究生物神经计算)。而OpenAI主要走的是深度学习(尤其是大语言模型)的道路。技术路线存在根本分歧。

其次,哈萨比斯内心有其孤傲的一面。直到那个时候,他内心仍视OpenAI为自己的追随者和模仿者,自然不屑于合作。

事实上,当时的AI研究圈子在学术层面还是比较开放的。无论是DeepMind还是谷歌大脑,包括那篇著名的Transformer论文,研究成果都会迅速公开。在研究层面合作空间不大,主要是在工程化和产品化的实践上,双方后来才逐渐拉开了差距。

问:DeepMind之前为实现AGI,启动了“盖亚”项目,试图在计算机中模拟真实世界来训练AI。这个项目为何后来难以为继?

周健工:可以这样理解。在“盖亚”项目启动时,AlphaGo已经攻克了围棋,DeepMind觉得自己在游戏这个AGI“试验场”取得了辉煌胜利。他们必然会寻找下一个目标,因为游戏环境终究有其局限性。

围棋棋盘有361个格点,边界清晰,规则明确。而自然界是连续的、复杂的、模糊的、高维的,与游戏环境截然不同。要真正证明自己是AGI,必须将其置于更接近真实自然的环境中进行验证。因此他们想到了“盖亚”项目。

这个项目在当时推进了两三年,并不成功,即使放到今天实现起来仍非常困难。这是一个极度超前的项目,在学术探索上绝对有价值,但DeepMind的目标从来不只是发论文,而是做出实实在在的成果。他们一直未能将其“做出来”,虽然探索很有价值,但也确实过于超前。

问:几年前谷歌收购DeepMind时,有多家公司参与竞购,包括扎克伯格,但哈萨比斯最终选择了谷歌。在您看来,当时他最看重谷歌的是什么?

周健工:首先,谷歌是当时最成功、实力最雄厚的互联网公司之一,资金充沛。

第二,谷歌作为一家搜索公司,是所有互联网公司中对AI最有远见、也最重视AGI的,这一点深得哈萨比斯之心。

第三,谷歌的文化契合。他认为谷歌的两位创始人谢尔盖·布林和拉里·佩奇身上带有科学家气质(都是斯坦福博士)。他们对科学探索有长线布局,比如谷歌X实验室涉足众多前沿领域。他们能将DeepMind定位为一个探索未来的机构,谷歌容得下这样的梦想。

此外,谷歌对AI技术的伦理和安全有较早的意识,其“不作恶”的价值观(至少在当年)与哈萨比斯的理念有相通之处。所以,谷歌从一开始就是他的首选。

过程中,马斯克也想收购。但哈萨比斯很清楚马斯克当时实力不足,且有其私心。马斯克谈论的是探索外太空、星际移民,哈萨比斯则认为这与专注实现AGI不是一回事,他不想成为别人宏大叙事的工具。

扎克伯格也接触过,但聊完后,哈萨比斯觉得扎克伯格对AGI的理解远不如谷歌深刻。

最后,一个决定性的时刻是,拉里·佩奇在一次散步时对他说:“你的目标不是想研究AGI吗?那你为什么不来谷歌?我这里已经为你准备好了一切。”这句话彻底打动并说服了他。

问:DeepMind被谷歌收购后,在大语言模型时代初期反而被OpenAI甩开。哈萨比斯在战略上是否存在误判?

周健工:进入谷歌后,资源(人力、算力、资金)变得极其丰富,他们同时探索多条技术路线,这本身是正常的。

但哈萨比斯本人在那个阶段的战略判断上,确实出现了偏差,或者说失误。他当时并不重视大语言模型。他曾在内部将研究布局分为三块:第一是强化学习(被他置于首位),第二是神经网络,第三是基于数据的归纳推理等。而语言,只被他视为第三块中的一个分支。由此可见,他战略上并未将大语言模型放在核心位置。

他更笃信强化学习的路径。另一方面,他认为语言数据过于抽象、“不接地气”。但他低估了移动互联网发展所积累的海量语言数据的价值,以及当时GPU算力突飞猛进之下,两者结合可能带来的突破。

他真正开始重视,是在GPT-2发布之后。当行业都在讨论OpenAI正在研发参数量高达1750亿的GPT-3时,DeepMind才开始全力追赶,但此时已经有些晚了。

当时DeepMind在研发一个基于Chinchilla的700亿参数模型“麻雀”(Sparrow),采用了当时最先进的缩放定律方法。与此同时,谷歌大脑也在研发多个模型,如Gopher、LaMDA、PaLM等,最大的参数量达到四五千亿。谷歌当时认为,这样足以超越GPT-3了。但他们没想到,OpenAI中间杀出了一个GPT-3.5(即ChatGPT背后的模型)。

更关键的是,到2022年夏天,GPT-4的预训练已基本完成,参数量接近2万亿。当你还在盯着GPT-3奋力追赶时,对手已经快把下一代产品做好了,这完全陷入了被动挨打的局面。

问:DeepMind被收购几年后,与谷歌总部的关系一度出现裂痕。您认为主要原因是什么?哈萨比斯在其中起到了什么作用?

周健工:这更像是一种特殊情境下的博弈,很难说是直接的冲突。哈萨比斯本人并非想挑起与谷歌的冲突。

谷歌对DeepMind始终非常重视,给予了全力的算力倾斜。DeepMind进行大量超前研究,需要耗费巨量算力进行反复实验和训练,其中包含许多失败的模型。其算力消耗一度比服务全球几十亿用户的Gmail还要多。

之所以出现博弈,是因为当时谷歌母公司Alphabet正在进行架构调整,希望将一些长期投入、暂未盈利的项目分拆出去,以便外部融资。DeepMind恰好处于这个位置上。

哈萨比斯团队内部本能地开始思考:是否要分拆出去?分拆后怎么办?联合创始人穆斯塔法·苏莱曼想得更多,认为这是一个独立的机会,甚至开始接触外部投资人,如蔡崇信、LinkedIn创始人雷德·霍夫曼(后者曾承诺投资10亿美元)。

谷歌高层对此想法也不尽一致。拉里·佩奇曾表示,如果DeepMind愿意分拆,可以给予资金支持继续研究。但新任谷歌CEO桑达尔·皮查伊的想法不同。

上层意见不一,下面的人自然要为自己的出路做打算,于是出现了所谓的“马里奥计划”(即与母公司博弈、寻求分拆的方案)。最终,皮查伊拍板决定不能分拆。谷歌以战略眼光认定,DeepMind所研究的AGI将决定公司的未来。从这一点看,谷歌始终对哈萨比斯抱有信心。

从某种意义上说,DeepMind与谷歌的关系最终得到了理顺。虽然大公司在工程和产品化速度上可能不如初创公司灵活,但谷歌强大的研究能力和在基础设施(如TPU芯片)上的长期投入,为DeepMind提供了坚实的基础。

因此,哈萨比斯本人在大规模工程部署、商业竞争和产品开发方面的能力,也是在谷歌这个平台上得以成长和放大的。这是一个相互成就的过程。

问:DeepMind从GPT-3时代就开始追赶,但直到去年之前,Gemini相比OpenAI仍有差距。在那些年,DeepMind屡战屡败的主要原因是什么?

周健工:首先,技术节奏上就慢了一到两拍。当OpenAI发布ChatGPT(基于GPT-3.5)时,GPT-4的预训练已经完成。第二年3月,GPT-4完成后续训练并发布。而DeepMind和谷歌大脑当时的模型,大多还瞄准着GPT-3进行对标。当GPT-4横空出世时,技术上确实落后了一代。

第二,ChatGPT是硅谷历史上最成功的科技产品之一,它迅速占领了全球用户的心智。AI发展了70年,但此前始终局限于象牙塔内的小圈子。ChatGPT的出现,让AI第一次真正进入主流大众的视野。直到今天,“ChatGPT”几乎成了AI的代名词,其周活用户已近9亿,今年破10亿毫无悬念。即便Gemini在规模和性能榜上实现超越,但作为一个独立的AI应用,其用户心智占有率仍难以匹敌。

第三,大公司病在当时暴露无遗。特别是当Meta的开源模型Llama推出后,对整个行业造成了巨大冲击。谷歌内部甚至流传出一句震惊行业的话:“大模型根本没有护城河。” Llama的发布让谷歌内部一度陷入混乱和危机感,连已处于半退休状态的创始人都被惊动,回到办公室坐镇。

第四,DeepMind自身的架构调整需要一个适应过程。中间经历了Bard模型灾难性的发布事件。最终,谷歌决定将谷歌大脑与DeepMind合并,由哈萨比斯统一领导,并集全公司之力打造统一的大模型品牌Gemini。这个合并与调整的过程,本身就耗费了半年左右的时间。

统一指挥后,团队才能心无旁骛地专注于Gemini的开发,直到2025年底才初步实现翻盘。

问:在这次逆袭过程中,相比DeepMind早期的成功,您认为主要的关键成功因素有哪些?

周健工:哈萨比斯一旦下定决心要赢得一场竞争,他是非常善于达成目标的。历史证明,只要给他足够的时间和资源,他想做的事情基本都能做成。

我认为很关键的一点,是谷歌强大的基础设施保障。整个TPU架构在模型训练和推理方面提供了持续的支撑。这不光是算力充足的问题,更是软硬件的深度协同。如何让新的TPU架构适配新模型,如何通过硬件实现下一步的技术亮点,如何从算力架构中最高效地“榨取”性能,这些都至关重要。最终,最强的Gemini 3大模型正是由TPU而非GPU训练出来的。

另外,谷歌的人才队伍相对稳定,资金供给也持续稳定。不像OpenAI,需要不断融资来支撑其庞大的开销和基础设施自建。DeepMind没有这些后顾之忧,可以专心致志地把Gemini大模型做好。无论是在原生多模态、长上下文理解、持续学习,还是世界模型等前沿方向的探索上,他们都可以心无旁骛。这些本来就是他们擅长的研究领域,专注让他们得以发挥出固有优势。

问:在这个过程中,哈萨比斯个人起到了什么样的核心作用?

周健工:他是整个谷歌AI的代言人,是谷歌AI战略的灵魂人物。

尤其是在获得诺贝尔奖之后,他对AI发展方向的观点更容易获得公众和业界的信任。他作为科学家的身份,以及将AI用于生物科技、药物发现等关乎人类福祉的领域的愿景,为谷歌AI建立了极强的可信度。

但另一方面,哈萨比斯对量子计算持怀疑态度。他认为基于图灵机的经典计算足以解决AGI所需的基本计算问题。而谷歌对量子计算非常重视,皮查伊近期还高调宣布量子计算可能在近几年取得重大突破。如果哈萨比斯不相信或质疑量子计算的作用,那么他未来能否在DeepMind的架构内包容乃至引领量子计算与AI的结合,这将是一个值得关注的潜在影响因素。

问:您认为现在的哈萨比斯,是一位合格的企业家吗?

周健工:我觉得哈萨比斯重新定义了什么是“科学研究的创新者”。这个评价一点也不比“企业家”低,他改变了许多进行科学研究的方法和范式。

当年采访他时,我曾非常好奇地问他:你整天做这些研究,但作为初创公司,投资人难道只看你发论文吗?

他的回答是,最初的想法就是用AI去发现和理解宇宙,解释周围环境的结构和底层运作逻辑。他说:“我无法超越费曼,无法超越爱因斯坦,但我要发明的AI将来能够超越费曼,超越爱因斯坦。”

他的做法,是通过创业的方式来实现科研突破。他最初非常讨厌学术机构的官僚气息和缺乏紧迫感的“散养”状态。他认为那种各自为政、零散发论文的模式,无法实现AGI这样的宏大目标。

因为哈萨比斯对自己怀有强烈的使命感,要用一生的时间去实现AGI。这种用创业的心态去做科研,用AI推动科学突破的模式,改变了整个科学研究的范式。

我认为,他甚至比作为一个单纯的企业家意义更为重大。如果想了解更多关于此类科技趋势与极客文化的讨论,欢迎来云栈社区的开发者广场交流。

问:长远来看,哈萨比斯仍是带领DeepMind继续前进的最合适人选吗?

周健工:哈萨比斯为自己设定的终极目标是实现AGI,而不是在谷歌内部谋求某个高级管理职位(比如取代皮查伊成为谷歌CEO)。尽管外界有过此类猜测,但我认为这既非他的兴趣所在,也非他最擅长的领域。

我觉得哈萨比斯唯一的目标就是实现AGI。他自己曾说,大概还需要五到十年时间,可能还缺一两个“Transformer级别”的重大创新。他依然认为在谷歌DeepMind这个平台上继续努力,是实现目标的最佳途径。至少在未来的三到五年内,我认为情况依然如此。




上一篇:耳机磁场或加剧空气磁性纳米颗粒脑内蓄积,研究揭示神经毒性风险
下一篇:AI战略定成败:大厂“增效”思维暴露转型困局,快手260亿投资难挽股价颓势
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-29 06:27 , Processed in 0.645230 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表