找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

1593

积分

0

好友

205

主题
发表于 2026-2-13 07:20:41 | 查看: 31| 回复: 0

数据中心服务器机柜内部布线图

近日,一家颇为神秘的英国AI芯片初创公司Olix(前身为Flux Computing)引发了行业关注。根据外媒报道,这家由00后创办的公司已成功获得2.2亿美元(约合人民币15亿元)的融资,使其估值一举突破10亿美元(约合人民币69亿元),正式跻身独角兽行列。

Olix成立于2024年3月,总部位于英国伦敦,创始人James Dacombe今年仅25岁。除了这家芯片公司,他同时也是另一家脑监测创业公司CoMind的创始人兼CEO。CoMind是他在18岁时创立的项目,目前已融资1亿美元(约合人民币7亿元)。

Olix创始人James Dacombe

瞄准AI推理市场,提出全新架构

Olix的业务核心并非训练,而是针对当下需求日益旺盛的AI推理场景。该公司正在研发一种旨在突破现有硬件瓶颈的新型AI芯片,目标是同时实现高吞吐量与低延迟的高交互性,以应对最为苛刻的AI推理工作负载。

其核心产品被称为光学张量处理单元(OTPU)。这是一款采用新型存储器与互连架构的光学数字处理器。Olix团队坚信,通过将SRAM架构光子学技术相结合,能够在每兆瓦吞吐量和总体拥有成本(TCO)上超越当前基于高带宽内存(HBM)的主流架构,同时在交互性和延迟方面显著优于纯粹的硅基SRAM架构。

截至目前,Olix累计融资额已达2.5亿美元(约合人民币17亿元)。据知情人士透露,该公司希望最快在明年向客户交付首批产品。

反思当前AI芯片的固有瓶颈

Olix在其官方阐述中,对当前主流AI加速器(如GPU和TPU)的架构局限提出了尖锐的分析。他们认为,现有架构已接近物理极限,无法同时为每个用户提供快速(低延迟)的推理服务

这种困境源于一个根本性的权衡:为了摊薄从HBM内存传输模型权重的能耗成本,并充分利用计算单元,系统必须对大量用户的请求进行批量处理。然而,大批量处理必然增加每个用户的等待时间(延迟),从而损害交互体验

问题的核心在于推理性能越来越受限于数据传输,而非计算本身。尽管从HBM2到HBM3/HBM4的迭代在能效和带宽密度上有所提升,但要实现下一次质的飞跃可能需要近十年时间,并且依赖于更复杂、昂贵的制造工艺。HBM性能提升带来的能效收益正在边际递减。

同时,通过增大芯片封装尺寸来缩短数据传输距离的策略也即将触顶。从英伟达Hopper架构到Rubin Ultra,封装尺寸大约增长了4倍,再增长4倍将逼近晶圆级封装的物理极限。更大的封装虽能改善延迟,但无法消除固有的数据传输延迟,阿姆达尔定律的限制日益显现。

因此,以缓存命中/未命中时间衡量的数据传输延迟已接近极限,并逐渐成为每个生成token(如AI对话中的一个词)总延迟的主要组成部分。

Olix的设计哲学与破局思路

Olix团队认为,要打造一款能够同时提供高吞吐量和高交互性的硬件,必须从根本上同时解决大规模数据传输的效率和延迟问题。任何只优化其中一个维度的方案,都只是在调整权衡的斜率,而非打破权衡本身。

基于此,他们提出了三个关键的硬件设计原则:

  1. 供应链独立性:新架构必须放弃高带宽内存(HBM)、先进封装等受限于现有巨头供应链的技术。初创公司难以在产能保障上与超大规模厂商竞争。
  2. 软件兼容性:硬件必须能够无缝支持现有的AI模型,不应要求模型具备特殊算术能力或改用全新的神经网络架构。
  3. 系统级协同设计:需要从传统的芯片级、光罩级设计思维,转向机架级的计算与数据传输协同设计,将其视为一个统一的系统。

Olix观察到,当前许多挑战者陷入了两种典型的失败模式:要么沿用“逻辑芯片-中介层-HBM”的老路,面临同样的交互性-吞吐量权衡;要么虽然意识到需要新范式,却未能跳出纯硅技术的局限性,无法彻底摆脱权衡。

行业观察与未来展望

Vertex Ventures普通合伙人、前Facebook基础设施高管Jonathan Heiliger对此评价道,AI推理需要对芯片制造方式进行彻底的重新思考,大规模重构系统级架构极其困难,而“James和他的团队执行速度,比拥有十倍资源的公司还要快。”

Olix的崛起也反映了英国在人工智能与半导体领域寻求突破的努力。目前,英国芯片公司的融资规模仍远落后于美国。另一家英国AI芯片创企Fractile日前也宣布,计划未来三年投资1亿英镑扩大本土业务。

随着大模型应用落地加速,推理需求呈现爆炸式增长,对专用、高效硬件的渴求也日益迫切。Olix以其独特的“SRAM+光子学”路径和年轻的创始团队背景,为这个高度集中、技术壁垒深厚的市场带来了新的变数。其产品能否如期交付并兑现性能承诺,将成为整个行业关注的焦点。关于这类前沿芯片技术的更多讨论与资讯,也欢迎在技术社区进行交流。




上一篇:Kafka消息重复消费详解:成因、危害与3大幂等性解决方案
下一篇:在NAS上使用Docker Compose部署无名杀:开源三国杀联机游戏指南
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-2-23 14:18 , Processed in 0.591203 second(s), 40 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表