找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1603

积分

0

好友

209

主题
发表于 昨天 04:23 | 查看: 5| 回复: 0

全光Scale-Up技术演进漫画封面

当AI模型规模从“百卡”迈向“千卡”、“万卡”,集群内部的通信压力急剧增加。传统的电互连方式在224G甚至更高速率时代,开始显露疲态。本文将结合漫画图解,深入探讨全光Scale-Up技术的必要性,并聚焦于阿里云发布的行业首个3.2T NPO(近封装光学)光模块,解析其技术原理、核心优势与产业意义。

一、AI Scale-Up 为何“渴求”超高带宽?

AI训练,尤其是大规模模型训练,其通信模式可以形象地理解为一场“全员大会”。每个GPU(或计算单元)都需要频繁地与其他所有GPU交换数据,这就是所谓的“All-to-All”通信模式。

MoE模型与带宽需求对比漫画

随着模型参数量的爆炸式增长,以及MoE(混合专家)等架构的普及,这种密集的数据分发与汇总成为了日常操作。Scale-Up(纵向扩展,即提升单个节点或机柜内的互联带宽)相较于Scale-Out(横向扩展,增加节点数量)对网络带宽提出了近乎苛刻的要求。网络带宽已成为限制整体算力效率的“木桶短板”,而不仅仅是配套角色。

二、铜互连的“物理墙”:趋肤效应与扩展性锁死

在224Gbps及更高传输速率下,传统的铜缆(电信号)互连遇到了难以逾越的物理瓶颈。

铜互连在224G时代面临的挑战漫画

  1. 趋肤效应:高频信号在导体中传输时,会趋向于在导体表面流动,导致有效导电面积减小,电阻增加,信号衰减急剧加大。这使得高速电信号的传输距离大幅缩短,可能局限在1米甚至更短的范围内。
  2. 密度与维护困境:为了满足极短的传输距离,GPU等计算单元不得不被紧密地封装在同一个机柜(AI Rack)内,导致散热空间拥挤,维护和维修变得异常困难。
  3. 扩展性锁死:跨机柜、跨机架的Scale-Up连接因为电信号衰减而变得不可行,系统规模被物理定律锁死。

那么,这个瓶颈到底是什么?答案就是从“电”转向“光”。光信号在光纤中传输几乎不受距离限制,且抗干扰能力强,是突破带宽和距离枷锁的必然选择。

三、技术路线之争:Pluggable、NPO 与 CPO

目前,将光技术引入计算互连主要有三种形态,它们与ASIC(专用芯片)的距离决定了其性能与可维护性的平衡。

三种光互连技术路线对比漫画

  1. 可插拔(Pluggable):光模块独立存在,通过前面板插拔。电路路径长(通常15-30cm),信号损耗大,功耗高,且前面板插槽数量有限,面临“密度墙”。
  2. CPO(共封装光学):将光引擎与ASIC封装在同一基板上,距离最近,性能潜力最高。但两者高度耦合,一旦光部分故障,可能牵连整个芯片,维护风险高,良率挑战大。
  3. NPO(近封装光学):介于两者之间。将光引擎移至ASIC芯片的旁边(同一PCB上),通过极短的电互连(通常<5cm)连接,实现了“物理紧邻,电气解耦”。

NPO的核心思想是“靠近,但不焊死”。它既获得了接近CPO的短距传输优势,降低了信号损耗和功耗,又保留了类似可插拔模块的可独立测试、更换和维护能力,被认为是当前技术条件下的“最佳实用落地点”。

四、NPO 的核心优势解析

阿里云3.2T NPO光模块的发布,并非单纯追求高带宽,其背后是一系列关键技术的突破和设计理念的创新。

1. 全光解耦:重构数据中心布局

NPO实现全光解耦的架构漫画

传统架构中,计算单元(xPU Box)和交换单元(Switch Box)通过电背板或短距线缆紧密耦合。采用NPO后,两者之间可以通过光纤直连。这意味着计算柜和交换柜可以物理分离部署,距离不再是限制。这不仅简化了机房布局和散热设计,也为资源池化和弹性伸缩提供了新的可能性。

同时,光引擎从前面板下沉到PCB板,释放了前面板空间,大幅提升了系统的带宽密度,并减轻了前面板的重量和风阻。

2. No-DSP线性直驱:更简单、更高效

NPO的No-DSP线性直驱优势漫画

传统高速光模块依赖DSP(数字信号处理)芯片对高速信号进行复杂的补偿和整形,这会带来额外的功耗(通常10W以上)和处理时延。

阿里云3.2T NPO模块实现了 “No-DSP线性直驱”。它通过精密的模拟电路设计和先进的光电芯片工艺,在无需DSP芯片的情况下,直接驱动光器件并保证信号质量(通过TDECO、接收灵敏度、误码率等“体检”)。这直接带来了更低的功耗更低的传输时延更简化的信号路径

3. 封装与散热的“甜蜜点”

NPO在封装与散热上的优势漫画

NPO模块采用高密度封装技术,将硅光(SiPh)芯片、激光器(如VCSEL)和电驱动芯片(EIC)高效集成在一个紧凑的模块内。其功耗控制在约20W级别,能效比优异,且规模部署后收益更明显。

更重要的是,NPO模块的位置布局避开了ASIC芯片上最热的区域(Hotspot),更有利于进行独立的、针对性的散热设计,避免了与计算芯片争抢散热资源。

4. LGA插座化:可更换=可运维

NPO采用LGA插座实现可维护性漫画

该模块采用LGA(栅格阵列)插座形式,可以像CPU一样被安装、拆卸和更换。这带来了运维革命:

  • 先测试,后组装:模块可以在系统集成前进行单独测试、老化,确保良率,责任清晰。
  • 降低维护风险:模块故障时,可以单独更换,避免了CPO方案中“一损俱损”(牵连ASIC)的高风险,大幅降低了维护成本和复杂性。
  • 支持开放生态:标准化的接口和封装形式,有利于吸引更多厂商参与,形成开放的供应链生态,而不是封闭的“黑盒”系统。

五、里程碑:阿里云行业首个 3.2T NPO 光模块

阿里云3.2T NPO光模块发布里程碑漫画

阿里云此次发布的3.2T NPO光模块,尺寸仅为22.5mm x 35.1mm,在极小尺寸内实现了单通道224Gbps、总带宽3.2Tbps的超高密度互连能力。其关键意义在于,它不仅是性能的突破,更是工程化与可落地性的典范,体现了 “能量产、能维护、能解耦” 的核心价值。

六、未来展望:开放解耦与双轨制发展

未来光互连技术发展路径漫画

展望未来,数据中心网络架构可能呈现“双轨制”并行:

  • 交钥匙封闭高性能路径:追求极致的性能和集成度,以CPO为代表,可能由少数巨头主导。
  • 开放解耦白盒路径:强调模块化、可维护性和生态开放,以NPO为代表,能吸引更广泛的产业伙伴。

在CPO技术完全成熟并解决可维护性挑战之前,NPO无疑是最具实操性的规模化落地技术方向。它教会我们:解决AI算力瓶颈,不仅要“跑得快”,更要“跑得稳”、“跑得省”,并且为未来的持续演进留下空间。

全光Scale-Up的时代已经开启,靠近、解耦、可维护、可规模化是其核心关键词。下一次,我们可以继续深入探讨CPO如何走向解耦之路。


本文通过图解方式探讨了前沿数据中心互连技术,更多深度技术解析与实践分享,欢迎访问 云栈社区 进行交流。




上一篇:AWS服务中断13小时背后:AI助手Kiro权限失控与运维安全反思
下一篇:AI编程范式转变:智能体优先、软件贤能政治与认知债的深度解析
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-2-25 09:10 , Processed in 0.430865 second(s), 43 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表