找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3180

积分

0

好友

442

主题
发表于 2025-12-19 19:17:01 | 查看: 75| 回复: 0

据路透社报道,谷歌正在内部推进一项代号为 TorchTPU 的计划,其核心目标是使其自研的 TPU 芯片能够高效、顺畅地运行 PyTorch 框架。为此,谷歌与 PyTorch 的主要维护方 Meta 展开了深度合作,并考虑将部分软件栈开源,以加速该方案的采用。

目前,TPU的销售已成为谷歌云收入增长的重要驱动力。相较于以往的支持尝试,谷歌此次投入了更多的组织资源和战略重视,意图将 TPU 打造为英伟达市场领先 GPU 的真正可行替代品。TorchTPU 预计需要12到18个月进入生产阶段。若该项目成功,它或将成为首个由开源生态驱动、直接冲击英伟达软件护城河的有力挑战者。

挑战CUDA的软件护城河

在AI工程实践中,开发者极少直接为底层硬件编写代码。无论芯片来自英伟达、AMD还是谷歌,开发者实际面对的是像 PyTorch 这样的高级框架。它已成为AI领域事实上的“默认抽象层”,模型训练、推理、调试和部署的工作流大多围绕其构建。

这正是英伟达的核心优势所在。其不仅拥有性能强劲的GPU,更关键的是构建了与 PyTorch 深度绑定的 CUDA 软件生态。过去十多年,英伟达的工程师持续优化,确保基于 PyTorch 的软件能在其芯片上获得最佳性能。大量的优化工作、算子实现和工程经验沉淀于此,构成了极高的生态迁移壁垒。

反观谷歌,其TPU长期以来主要围绕内部使用的 JAX 框架和 XLA 编译器进行优化。这使得外部开发者若想在TPU上获得媲美英伟达GPU的性能,往往需要付出大量的额外工程努力。尽管JAX在谷歌内部负载上效率卓越,但对于已经基于 PyTorch 构建AI基础设施的企业客户而言,TPU的采用门槛较高,甚至成为瓶颈。

谷歌的战略布局与Meta的合作动机

自研TPU是谷歌的重点战略。自2022年加大TPU产量与对外销售力度以来,其显著拉动了谷歌云的收入增长。今年,谷歌已开始直接向客户的数据中心销售TPU,而不再局限于云租赁服务。组织架构上,谷歌老将Amin Vahdat近期被任命为AI基础设施负责人,直接向CEO桑达尔·皮查伊汇报,彰显了其战略优先级。

谷歌最新的第七代TPU(代号Ironwood)针对推理任务优化,具备大容量共享内存,单个SuperPOD可连接多达9216个芯片,旨在解决大型混合专家(MoE)模型的内存瓶颈。随着TPU战略的扩张,消除 PyTorch 的兼容性障碍已成为谷歌必须走的关键一步。

Meta作为 PyTorch 的创建者和主要推动者,之所以与谷歌合作,也有其现实考量:对英伟达GPU的过度依赖导致推理成本居高不下。通过合作优化PyTorch-on-TPU,Meta有望获得更经济的推理算力,增强在GPU采购谈判中的议价能力,并推动其人工智能基础设施的多元化,降低供应链风险。

有消息称,从2027年起,Meta可能开始租赁或采购谷歌的TPU芯片用于其数据中心。早期的合作模式可能多为谷歌托管的服务,即由谷歌提供芯片、软件和运维支持。这也标志着谷歌正在向商业芯片供应商转型。据估计,此举可能抢占英伟达年收入的10%,涉及金额高达数十亿美元。

行业影响与潜在挑战

如果TorchTPU成功,将显著降低企业从英伟达GPU生态转向替代方案的迁移成本。当前,已有不少科技巨头在寻求突破英伟达的生态锁定:除了谷歌的TPU,亚马逊AWS推出了新一代Trainium 3芯片,微软也在推进自研的Maia加速器。这些努力正在逐步削弱CUDA在软件层的唯一性地位。

行业分析认为,到2026年,随着更多企业完成对自研或非英伟达芯片的软件适配,算力市场可能从“GPU一家独大”逐渐过渡到多架构并存的新阶段。

然而,TorchTPU也面临挑战。外界质疑主要集中于TPU的产能是否能与英伟达庞大的GPU供应链匹敌。此外,GPU在人工智能及其他领域的应用更为广泛通用,而TPU可能仍需在特定任务和场景中证明其综合竞争力。英伟达也可能通过更深度的PyTorch集成或自身的开源策略来巩固其生态优势。




上一篇:免费VPS服务器搭建节点教程:Lunes Host注册与一键脚本部署指南
下一篇:慢速DoS攻击原理与防御实战:使用SlowHTTPTest模拟及Apache安全加固
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-2-9 02:59 , Processed in 0.334622 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表