大约一年前,便有行业消息称苹果正在研发一款代号为“Baltra”的人工智能芯片。据悉,该芯片由苹果设计,并在博通的协助下完成,将采用台积电的3nm制程节点(可能是N3E或N3P工艺)制造,原计划于2026年进入大规模生产阶段。

根据TECHPOWERUP的最新报道,近期泄露的信息显示,“Baltra”芯片的开发周期似乎有所调整,其量产时间可能推迟至2027年,具体延迟原因尚不明确。此前苹果曾表示,为支持Apple Intelligence与私有云计算服务,其数据中心正在进行全面升级,将换装美国制造的、搭载M2 Ultra芯片的服务器设备。另有消息指出,基于M4系列芯片的服务器版本也已在准备交付中。
消息进一步透露,“Baltra”将是一款以推理(Inference)为导向的专用芯片。分析指出,苹果或将以该芯片为基础,构建大规模的计算集群,其设计思路可能与英伟达的GB300类似,由64颗芯片组成并配备LPDDR内存。这种专注于推理的集群设计,在成本上远低于兼顾训练的传统AI芯片,却能更好地满足苹果的实际需求。因为苹果并未选择自行训练超大规模AI模型,而是以每年约10亿美元的费用,租用谷歌拥有3万亿参数的定制版Gemini模型,来驱动其云端Apple Intelligence服务。
正因如此,苹果无需为高强度的模型训练环节预留庞大的算力,可以将芯片的全部性能集中于模型执行与推理。基于这种“推理优先”的核心战略,“Baltra”的芯片架构必然与市面上主流的通用AI训练芯片存在显著差异。
苹果的这一举措,标志着其在构建云端数据中心基础设施时,正朝着软硬件深度整合、并根据自身业务负载特性进行定制化的方向迈进。通过专用推理芯片与外部大模型授权的结合,苹果试图在控制成本与保证服务性能之间找到最佳平衡点。
|