4470 积分	0 好友	584 主题

深度解析阿里云102.4T交换机：国产芯片、NPO与扩展架构全揭秘

发表于 2026-3-10 12:21:06 | 查看: 608| 回复: 0

大家最近注意到了吗？阿里云发布了一款采用国产芯片、带宽高达102.4T的NPO交换机。这款产品最早在去年的云栖大会上露面，最近阿里又公布了一些技术细节，引发了不少关注。

卡通人物兴奋地指着102.4T国产芯片NPO交换机

今天，我们就来深入剖析一下这款交换机，看看阿里这套方案到底“道行”有多深。

基于NPO的国产四芯片交换机硬件架构图

基于NPO的国产四芯片交换机硬件架构图

基于NPO的交换模组实物图

基于NPO的交换模组实物图

阿里这款102.4T NPO交换机的核心亮点可以总结为三点：

目前，国产交换芯片单芯片最大能力还停留在51.2T（还是某厂商自用），商用芯片市场的天花板是25.6T。这与海外厂商组合（Cisco, Nvidia, Marvell, Broadcom）已有单芯片102.4T方案相比，仍有差距。

那怎么办呢？一颗不够，两颗也不够，只能拿4颗25.6T“组团”。但组团有学问，怎么连接这4颗芯片，形成高效的交换矩阵，这里面有好几种“阵法”。

传统的CLOS方式无阻塞4倍扩容

传统的CLOS方式无阻塞4倍扩容

传统的CLOS架构通过多层级、全互联的方式实现无阻塞交换。但从上图可以算出，用CLOS方式将端口扩展到4倍，所需芯片数量会膨胀到12倍，效率不高。如果用来做单体设备，成本会非常高，市场竞争力会很弱。

CLOS法的核心代价太高。而平面法是一种线性扩容方法。我们来看下面这个例子。

平行扩展法示意图

平行扩展法示意图

平面法只需2台交换机就实现了组网端口的翻倍，实现了线性扩容。但这种方法有个前提：互联端口必须可以拆分。本质上，它通过拆分端口让交换机具备更大的连接能力，从而拥有更多邻居。

然而，这带来了一个现实难题：光模块本身尺寸太小，无法在其上进行拆分操作。解决方案是在MPO线缆上做拆分。例如，一根400G的MPO线缆，可以拆分成4对1收1发的LC尾纤，每一对连接一个邻居。

400G MPO线缆拆分为4对LC尾纤示意图

400G MPO线缆拆分为4对LC尾纤示意图

拆分需要在两侧都进行，再通过LC连接器将两侧的尾纤对接起来。这种方式的弊端显而易见：布线工程量成倍增加（这里是4倍）。同时，由于互联中段存在开放的LC连接器，会增加信号插损，光纤端口受脏污的风险也增大了，给运维排障带来了更高的复杂度。

工程上可以引入无源光器件shufflebox来简化布线，但shufflebox作为一种固定交叉连接器，使用不灵活，依赖确定性的拆分方案。在快速变化的智算项目中，这点很难保证。而且，它同样无法避免开放连接器引入的问题。

描述光纤布线混乱的幽默插图

描述光纤布线混乱的幽默插图

阿里的NPO方案，正是针对上述平面法中“拆分+开放连接”的弊端进行了优化。

阿里的NPO方案架构图

阿里的NPO方案架构图

这个方案在布线上的简化非常明显：

当然，阿里这个方案的核心价值在于战略意义：

战略意义1：能够用较小规格的国产交换芯片，以相对经济的代价，搭建出能与海外对标的大规格交换机。这次的4颗25.6T拼出102.4T就是一个例子。
- （当然，这技术并非独有，海外厂商也可以用，例如NVIDIA就用4颗102.4T的芯片搭出了409.6T的怪兽SN6800。）
  
  NVIDIA SN6800交换机概念图
战略意义2：在从可插拔光模块到NPO/CPO（共封装光学）的技术演进道路上，做出了关键的工程验证。同时，NPO方案最大程度地保留了阿里在可插拔光模块领域培育多年的供应链生态，并使其得到进一步深化。