5876 积分	0 好友	768 主题

摩尔线程MUSA统一架构与花港GPU技术全景：发布万卡智算集群与多款芯片

发表于 2025-12-25 17:17:59 | 查看: 274| 回复: 0

2025年12月20日，摩尔线程首届MUSA开发者大会在北京召开。作为聚焦全功能GPU的技术盛会，大会系统展示了以自主MUSA统一架构为核心的全栈技术成果与前瞻布局。

本次发布的核心成果包括：

1、新架构“花港”亮相：发布全功能GPU架构“花港”，支持FP4到FP64的全精度计算，算力密度提升50%，效能提升10倍。未来将基于该架构推出高性能AI训推一体“华山”芯片与专攻高性能图形渲染的“庐山”芯片。

2、“夸娥万卡”高效训练：发布夸娥万卡智算集群，展示了其支撑万亿参数模型训练的工程化能力与可靠性，在多项关键精度指标上达到国际主流水平。

3、推理性能实现跨越：摩尔线程联合硅基流动，在DeepSeek R1 671B全量模型上实现性能突破，MTT S5000单卡Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s，树立国产推理性能新标杆。

4、超节点架构前瞻：分享面向下一代超大规模智算中心的MTT C256超节点架构，着眼高密硬件设计，旨在实现极致智算性能。

5、全新个人智算平台：正式发布搭载智能SoC芯片“长江”的AI算力本MTT AIBOOK，旨在赋能“摩尔学院”的广大开发者与学习者。

6、图形进化与前沿探索：揭晓硬件级光线追踪加速与自研AI生成式渲染技术，并展示了在具身智能、科学智能（AI4S）、AI for 6G等前沿领域的深度布局。

这一系列成果标志着摩尔线程已构建起一套以自主统一架构为根基、贯穿“芯-边-端-云”的完整技术栈，为国产智能计算生态的持续演进提供了坚实、开放的平台级支撑。

战略基石：MUSA统一架构的进化与开放

MUSA（元计算统一系统架构）是摩尔线程自主研发的全栈技术体系，覆盖从芯片架构、指令集、编程模型到软件运行库的全链条。

MUSA为全功能GPU奠定了技术根基，可高效支持AI计算、图形渲染、物理仿真和科学计算、超高清视频编解码等全场景高性能计算需求。

历经五年深度研发，全新升级的MUSA 5.0在统一性、效能与开放性上取得关键突破：

基于MUSA体系，新一代全功能GPU架构“花港”在计算密度、能效及图形技术等方面实现全面突破：

基于“花港”架构，摩尔线程公布了两款未来芯片的技术路线：

本次大会正式发布了具备全精度、全功能通用计算能力的夸娥万卡智算集群。其在万卡规模下实现高效稳定的AI训练与推理，训练线性扩展效率达95%，并与国际主流生态高度兼容。

在图形计算领域，其产品已全面支持DirectX 12、Vulkan 1.3等主流API，并即将完整支持DirectX 12 Ultimate。

在核心渲染技术上实现两项关键突破：

在前沿计算场景的布局包括：

生态建设是GPU行业的核心。摩尔线程构建了从硬件工具、算力支撑到人才培养的赋能体系。

深化人才培养：以摩尔学院为平台，汇聚近20万开发者，并通过共建行动覆盖全国200多所高校。本次宣布建设MUSA生态中心并发布开发者计划。
发布AI算力本：MTT AIBOOK搭载自研“长江”智能SoC，提供50TOPS端侧AI算力，实现从芯片到开发环境的全栈整合，为开发者提供“开箱即用”的体验。

大会同时预告了基于“长江”SoC打造的迷你型计算设备MTT AICube。