为了在竞争日益激烈的AI芯片市场中拓展版图,谷歌正积极探索利用其雄厚的财务实力来构建更广泛的人工智能生态系统,从而更有效地挑战市场领导者英伟达。
尽管谷歌的芯片已被广泛应用于AI工作负载,甚至连Anthropic这样的明星初创公司也是其用户,但谷歌在寻求进一步发展的道路上正面临多重挑战。据知情人士透露,这些挑战包括来自制造伙伴的瓶颈,以及主要云计算竞争对手——它们本身就是英伟达处理器最大的买家之一——对采用谷歌芯片的兴趣有限。
知情人士称,为了扩大潜在市场,谷歌正在加大对数据中心合作伙伴网络的财政支持力度,这些合作伙伴能够为更广泛的客户提供计算能力。
例如,谷歌正洽谈向云计算初创公司Fluidstack投资约1亿美元,此举对Fluidstack的估值约为75亿美元。Fluidstack是众多“新云”公司中的一员,它们为人工智能公司及其他企业提供计算服务。CoreWeave是最大的新云运营商之一,其主要提供对英伟达图形处理器(GPU)的访问。
知情人士表示,谷歌希望借此助推Fluidstack的增长潜力,并鼓励更多计算服务提供商使用其自主研发的人工智能芯片——张量处理单元(Tensor Processing Unit,简称TPU)。
此外,谷歌也曾与多家数据中心合作伙伴探讨扩大财务投入,这有望进一步增加对TPU的需求。此前,谷歌已为Hut 8、Cipher Mining和TeraWulf等公司的项目提供融资支持,这些公司正从加密货币挖矿业务转型开发数据中心。
据知情人士透露,谷歌云计算部门的一些管理人员近期重新讨论了一项长期存在的内部议题:将TPU团队重组为一个独立的部门。这一举措可能为谷歌打开更多投资机会的大门,甚至包括引入外部资本。
然而,任何潜在的独立部门都将面临一个显著挑战:谷歌自身的云业务在很大程度上也依赖于英伟达的芯片。对此,谷歌的一位代表回应称,目前没有重组TPU部门的计划,并强调保持芯片团队与公司其他部门(如负责开发Gemini人工智能模型的团队)的紧密联系具有诸多优势,例如便于开发者根据需求修改芯片设计。
回顾历史,谷歌自2018年起开始通过其云服务销售TPU的使用权。虽然传统上通过其云计算部门来招揽用户,但根据行业研究机构SemiAnalysis的分析,谷歌也直接向外部客户销售TPU芯片。
这一系列举措都旨在扩大谷歌芯片的潜在市场。一些AI客户对TPU在训练特定模型和执行推理任务方面的效率赞誉有加。推理是指AI模型利用训练成果生成输出(如聊天机器人的回答)的过程。
随着AI浪潮席卷全球,TPU团队的重要性与日俱增。领导谷歌芯片和网络开发的Amin Vahdat最近被提升为AI基础设施首席技术官,直接向首席执行官Sundar Pichai汇报。
去年四月,谷歌推出了第七代TPU,代号为Ironwood,据称是专为AI推理任务设计的。工程师们指出,与最初为图形渲染设计的GPU相比,TPU在处理对精度要求不那么苛刻的海量AI计算时,有时能表现出更好的适配性。
截至目前,谷歌与博通公司合作设计并生产其TPU,并采用台积电作为代工制造商。
然而,谷歌在提升TPU出货量方面可能面临现实阻碍。熟悉半导体供应链的人士指出,由于AI相关需求激增,台积电的先进制程产能已十分紧张,因此可能会优先满足其最大客户英伟达的需求,而非谷歌。同时,作为AI芯片关键组件的内存芯片若出现全球性短缺,谷歌也极易受到影响。
过去一年,越来越多从事AI开发和运营的公司对谷歌的TPU表现出兴趣,希望利用更具成本效益的计算能力,并避免对英伟达的过度依赖。
《华尔街日报》曾在去年11月报道称,Meta Platforms就使用谷歌芯片进行过洽谈。不过,Meta在本周进一步深化了与英伟达的合作,签署了价值数百亿美元的芯片及其他硬件采购计划。而去年10月,Anthropic宣布将扩大对谷歌云计算技术的使用,规模可能涉及多达100万颗TPU芯片。
尽管如此,主要的大型云服务提供商对采用谷歌TPU似乎仍持谨慎态度。业内人士分析,部分原因在于它们将谷歌视为直接的竞争对手。例如,亚马逊旗下的云计算部门AWS也早已开发了自家的人工智能芯片。
参考链接
对这场围绕AI芯片霸主地位的竞赛,以及它将如何塑造未来的智能与云计算格局,我们持续关注。欢迎在云栈社区交流你的看法。