找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

2540

积分

0

好友

338

主题
发表于 4 小时前 | 查看: 4| 回复: 0

超节点好不好?当然好!

现在大家都知道,跟传统的8卡机相比,超节点才是真正干大事儿的。

对比8卡机与超节点的概念漫画

拿来训练更大的模型,尤其扛住智能体爆发后,海量、实时、复杂的推理需求,超节点已经成为算力基础设施的基本单元。

描绘智能体爆发带来算力需求的漫画

好归好,大家又觉得跟一堆传统8卡机相比,超节点是个新事物,不太好拿捏。

传统8卡机堆叠与超节点的对比漫画

的确,从当下市面上的超节点看,入手门槛有点高。价格、布线复杂、机房改造和后期维护,每一样都是门槛。

描绘超节点高门槛的阶梯漫画

但是,从现在起,企业级用户部署和使用超节点的门槛,被大幅降低了。

刚刚,中科曙光下了“狠手”,猛砸这些门槛。

3月26日,曙光发布业界首个箱式无线缆超节点 scaleX40。

中科曙光scaleX40宣传海报

scaleX40采用标准箱式高密集成设计,旨在打破传统超节点成本高昂、部署繁琐、运维复杂的行业痛点。

解决成本、部署、运维难题的超级英雄漫画

那么,这款 scaleX40 到底有哪些亮点,能担得起“降低门槛”的重任?

① 性能超级强悍

别看身材很紧凑,却能一口气塞下40张AI加速卡,整机火力全开,训练更快,推理更高效。

展示scaleX40算力参数的漫画

不光40卡组团厉害,每张卡单拎出来也超级能打,支持全精度计算,拥有超大显存和高速互连能力。

GPU加速AI计算特性说明图

② 一级互连,真正的Scale-UP

如何让40张卡组团战力不打折?一级互连的“真 scale-up”架构是关键。

一级互连(Full mesh)网络拓扑示意图

所谓一级互连,是指所有AI加速卡之间的互通都不需要多级中转。一跳直达,对等通信,实现低延迟(单向通信时延百ns级)、高带宽(聚合带宽>17TB/s)。

多级互联与一级互连的对比动图

同时,还支持内存语义、统一显存编址。这就意味着40张加速卡不是一盘散沙,而是真正抱团,化身一张显存更大、算力更强的超级加速卡。

统一显存编址概念动图

③ 无线缆正交架构

scaleX40凭啥成为世界上首个无线缆箱式超节点?又凭啥做到40卡一级互连?这个正交架构是核心。

正交架构组装过程示意图

简单来说,就是计算节点和交换节点通过正交的方式直接连接,从此摆脱了线缆的束缚。这不仅省去了线缆的维护烦恼,还带来了更高的可靠性,以及更低的功耗(可用性比铜缆模式提高10倍,功耗比光纤连接降低40%-70%)。

摆脱线缆束缚的漫画

④ 标准尺寸,灵活扩展

scaleX40单机吃下40卡,但身材一点不臃肿,“腰围”是19英寸标准机架规格,普通服务器机柜就能装。而且一个单机柜还能装下双PoD,实现80张加速卡的集群密度!

单柜单PoD与单柜双PoD示意图

⑤ 开箱即用,生态兼容性好

scaleX40虽然是新品,但用户完全不需要为上手、迁移担心。配套的开发工具、基础软件、AI大模型与应用全部就绪,开箱即用,主流大模型可以轻松迁移。

开箱即用生态配套漫画

这么说吧,scaleX40就像是个超节点领域的“六边形战士”,在算力、互连、架构、部署、生态、可靠性等各项能力值上都拉满了。

scaleX40六边形能力图

不止超节点,更有全栈配套

在企业级用户的实际应用中,不只需要超节点,AI落地更需要全栈AI基础设施(AI Infra)。

所以,除了scaleX40这个企业级AI Infra“最佳”构建单元,曙光还提供了全栈配套:

① 解决存储瓶颈,曙光提供最懂AI的存储:ParaStor。
ParaStor存储解决方案漫画

② 让多超节点横向无损扩展,曙光提供国产IB网络:scaleFabric。
scaleFabric网络解决方案动图

③ 搞定开发运维难题,曙光提供一站式开发、调度、运维平台:SothisAI。
全栈AI Infra树形结构图

算力普惠,从scaleX40开始

如今,超节点已经从互联网、大模型巨头渗透到千行百业,越来越多的企业级客户,开始考虑用超节点作为最佳算力载体。

但那些高门槛怎么破?中科曙光用 scaleX40 给出了一个答案——从成本、可落地性、可维护性以及需求适配性来看,它无疑是一个更优的选择。

跨越超节点门槛的攀登漫画

金融、科教、电网、医疗、运营商……过去这些企业级客户不是不想上超节点,而是受限于性价比和部署运维复杂度。

现在情况不同了,一台真正让企业“买得起、用得上、用得好”、能支撑生产级AI业务的超节点,已经来了。

买得起、用得上、用得好价值阶梯图

对于正在寻求构建或升级自身AI算力平台的企业技术决策者而言,关注像 scaleX40 这样能切实降低总拥有成本(TCO)和部署难度的基础设施产品,正变得愈发重要。技术的普及,往往始于门槛的降低。想了解更多前沿技术解读与深度讨论,欢迎来云栈社区交流分享。




上一篇:内容创作者高效工作流:用ChatGPT/DeepSeek生成结构,XMind呈现的免费组合
下一篇:NeurIPS 2026 投稿规则风波:顶会政策突变,学界抵制下三日内火速道歉
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-3-29 06:32 , Processed in 0.516583 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表