找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1615

积分

1

好友

227

主题
发表于 9 小时前 | 查看: 2| 回复: 0

图片

在人工智能的资本支出规模堪比大型基础设施项目的当下,行业整合与技术创新正同步加速。Celestial AI决定不再以独立初创公司身份运营,其联合创始人兼首席运营官Preet Virk表示,接受Marvell的收购是基于物理规律、系统效率与市场时机的综合考量。

根据已签署的最终协议,Marvell对Celestial AI的收购预计将于2026年第一季度完成。Virk指出,当前AI资本支出已接近美国GDP的3%,这种量级在历史上仅见于铁路建设或战时工业动员等时期。超大规模企业正在构建他称之为“AI工厂”的系统,旨在以工业规模生产AI Token(推理结果)。

算力利用率之殇:高达70%的闲置

然而,这些“AI工厂”面临着严峻的效率挑战。当前领先AI模型的浮点运算利用率普遍低于30%,这意味着约七成的昂贵计算资源处于闲置状态——它们并非等待指令,而是在等待数据。

Virk认为,这正是Celestial AI的价值所在。Marvell在网络、安全和数字信号处理领域拥有深厚积累,而Celestial则提供了关键的互连技术,能够将这些组件整合成一个高效、连贯的系统,二者形成共生关系。

其核心技术是名为“光子织物(Photonic Fabric)”的架构。该技术的核心创新在于,其芯片将光学输入/输出(I/O)单元置于裸片中央,而非传统的边缘位置。

传统设计将芯片边缘视作I/O的“黄金地段”。通过将光学器件移至中心,Celestial释放了边缘空间,可用于部署DDR、HBM、PCIe和CXL等控制器。由此诞生的是一种光学内存设备,能够以低于200纳秒的往返延迟,将高达33TB的内存连接至一个XPU(各类加速处理单元)。

这对于生成式AI推理至关重要,因为其对计算和内存的需求并不对称。客户常常为了获得更多高带宽内存而过度购买加速器。光互连允许内存独立于计算单元进行扩展,从而显著提升系统整体利用率并降低成本。

连接的四重维度:从芯片到数据中心

Celestial将其技术应用划分为四个不同层次的连接“尺度”:

  1. 封装内扩展:指单个封装内部多个裸片之间的互联。得益于其调制器能承受先进封装内部的高温,最多可将10个裸片通过光链路连接。
  2. 纵向扩展:涉及连接数千个GPU,跨越多个机架。这是铜缆在超过数米后难以胜任的距离,而Celestial的光学方案能覆盖约50米范围。
  3. 横向扩展:指通过以太网交换机实现计算集群(Pod)之间的互联,这正是Marvell的传统优势领域。
  4. 跨越扩展:通过高带宽光链路连接地理上分散的多个数据中心,构建更大规模的网络拓扑

能效:核心差异化优势

能效是Celestial技术的突出优势。其互连技术的运行能耗约为每比特2.4皮焦耳,而其主要竞争对手的指标通常在6到7皮焦耳之间。

在大型系统层面,优势更为显著。使用铜缆和NVLink的纵向扩展操作,每比特能耗可能高达53皮焦耳。Celestial声称能以低于15皮焦耳的能耗实现相同功能。

Virk强调,现代数据中心超过一半的能源被用于移动数据,而非执行实际计算。若能大幅削减这部分能耗,同一设施可产生的AI Token数量近乎翻倍。此外,物理规律为铜互连设定了硬性上限,可能在NVLink发展到144或172通道时触及瓶颈。要连接成千上万个GPU,光学技术不是备选,而是必然。

以设计应对热挑战

将光学器件集成到先进封装内部,首要技术障碍是散热。千瓦级系统会产生动态热环境,导致许多光学元件性能不稳。

Celestial避开了对温度敏感的微环调制器,转而采用电吸收调制器。这种调制器具有热稳定性,体积与微环相当,并可放置在驱动器附近。这种近距离布局降低了电容与功耗,同时使调制器能快速响应ASIC的温度变化。

在制造方面,Celestial的电芯片基于台积电的4纳米或5纳米工艺制造。台积电通过其风险投资部门VentureTech对该公司进行了投资,认可了其技术的独特性。Virk预计,在Marvell的支持下,双方合作关系将更加紧密。

其封装工艺采用标准的类CoWoS流程,并未使用特殊材料。公司提供自研的光学芯粒以及用于光纤连接的详细工艺“配方”。这些已获专利的配方旨在以低成本实现高质量,且不依赖于单一的外包封装测试(OSAT)供应商。另一项专利涵盖了一种玻璃块透镜插入方法,使光学组件能经受标准的包覆成型工艺。

带宽方面,Celestial通过可扩展的IP宏单元实现灵活配置。这些宏单元非常紧凑,每毫米边缘长度能提供接近每秒1.5太比特的传输速率。客户可根据需要部署多个宏单元,以实现8、14或16 Tbps等不同等级的总带宽。结合波分复用技术,还能进一步减少所需光纤数量。

模块化产品路线图

公司的产品路线图体现了模块化设计理念:

  • 用于纵向扩展系统的共封装光学器件,预计在2026年下半年展示成果。
  • 光学多芯片接口,旨在使大型多裸片封装在软件层面呈现为单一实体。
  • 光子织物网络接口卡,为传统服务器提供原生光连接能力。
  • 基于前述33TB内存目标构建的内存设备,旨在实现加速器内存的机架级扩展。

当被问及Lightmatter或Ayar Labs等竞争对手时,Virk没有直接对比,而是强调了实际部署、客户基础以及被Marvell选中的事实。他认为,收购方对整个领域进行了详尽评估后选择了Celestial,这不仅仅是一张信任票,更是对其技术在构建未来AI工厂中核心地位的认可。




上一篇:AMD主导消费级CPU市场:亚马逊销量榜前20占19席
下一篇:AI内存需求驱动HBM价格上涨,三星、SK海力士2025 Q4毛利率或超台积电
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2025-12-24 17:17 , Processed in 0.229490 second(s), 39 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2025 云栈社区.

快速回复 返回顶部 返回列表