今日,阿里巴巴集团旗下半导体公司平头哥,在其官网正式发布了高端AI训练与推理一体芯片 真武810E。
这款芯片正是此前被央视《新闻联播》报道的阿里自研PPU芯片。它的发布不仅标志着阿里在AI芯片领域布局的关键落地,也让其全栈AI战略的核心阵型——“通义实验室、阿里云、平头哥”组成的AI黄金三角首次完整浮出水面。

作为此次发布的核心产品,真武810E 已经在阿里云完成了多个万卡级集群的部署。目前,这款芯片服务于国家电网、中科院、小鹏汽车、新浪微博等超过400家政企及企业客户,覆盖了能源、科研、汽车、互联网等多个核心业务领域,其规模化应用能力得到了充分验证。据了解,阿里巴巴内部已将这款PPU芯片大规模应用于千问大模型的训练与推理环节,并结合阿里云完整的AI软件栈进行了深度优化,旨在为客户提供“芯片+云+模型”的一体化产品与服务解决方案。

从技术参数上看,真武810E的表现确实可圈可点。该芯片采用了平头哥自研的并行计算架构与ICN(片间互联)技术。单卡配备了高达96GB的HBM2e内存,并搭载了7个独立的ICN链路,使得片间互联带宽达到了惊人的700GB/s。这种高带宽设计让它可以根据实际算力需求,灵活配置多卡组合,广泛适配AI训练、AI推理 以及自动驾驶等多元化应用场景。
有业内人士分析称,从关键性能指标对比来看,真武PPU的整体性能已经超越了英伟达的A800及一些主流国产GPU,与英伟达特供版的H20芯片处于同一水平线。另有外媒最新报道指出,其后续升级版产品的性能表现更优于英伟达的A100。凭借稳定可靠的性能和突出的性价比,真武PPU在业内正逐步积累起良好的口碑。

(图说:平头哥官网上的“真武”PPU产品介绍页。)
在平头哥官网上,真武810E的六大核心优势被明确列出:全自研架构、高性能算力、强互联能力、高易用性、规模化验证以及芯云一体协同。其中,自研的ICN片间互联技术凭借其高性能、高带宽、低延迟的特性,成为了支撑大模型高效训练与推理的关键;每颗真武810E配备的7个ICN端口,搭配自研的互联加速库,能够实现多卡之间的高效协同工作,精准匹配大模型训练 对大规模算力的苛刻需求。
在软件生态方面,平头哥自研的AI产品软件栈拥有完备的工具链和统一的编程接口,可以支持端云一体的业务部署。其核心优势在于高效性——支持基于SDK和API快速开发适配应用,便于用户搭建自主生态;以及高兼容性——延续主流编程环境,无需修改代码即可适配主流AI框架 ,这无疑降低了开发者的使用门槛。
具体到应用场景,真武810E覆盖了四大核心领域:在自动驾驶领域,它兼容超过50个常见模型,支持多种架构的训练与推理,并已实现万卡集群部署;在AI训练 领域,它原生支持多框架,依托高速片间互联实现了优异的集群线性加速比;在AI推理领域,它兼容主流推理引擎,搭配自研框架与大容量内存,有效优化了大模型推理效率;在多模态应用领域,其在文生视频、图文交互等场景下的实测表现突出,提供了高性价比的算力选择。
此次真武810E的发布,也让阿里内部被称为“通云哥”的AI战略阵型正式对外亮相。该阵型旨在向AI超级计算机迭代,整合了平头哥的自研芯片、阿里云的强大云平台以及通义千问大模型三大优势,力求实现从底层芯片、云平台基础设施到上层模型架构的深度协同,从而提升大模型训练与推理的整体效率,构筑差异化的技术壁垒,进一步完善全链路的AI生态。

成立于2018年的平头哥,已经构建起多元化的芯片产品矩阵。除了本次发布的真武810E,其产品线还涵盖了含光800 AI推理芯片、倚天710服务器CPU、镇岳510 SSD主控芯片,以及羽阵611/600超高频RFID芯片等,形成了覆盖数据中心、边缘计算到物联网的全场景芯片布局。
阿里巴巴在计算领域的战略投入已持续17年。从2009年创建阿里云,到2018年布局芯片业务成立平头哥,再到2019年启动大模型研究,最终完成了如今“通云哥”的生态布局。平头哥将自己定位为AI时代的芯片基础设施创新者,聚焦于数据中心及IoT芯片研发,致力于提供端云一体的普惠算力。对于关注前沿技术与产业动态的开发者而言,像云栈社区这样的技术论坛,是获取此类深度资讯、参与交流讨论的理想平台。
|