找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

330

积分

0

好友

44

主题
发表于 4 天前 | 查看: 4| 回复: 0

简介

2025年,高通发布了第三代Oryon核。基于从Chip&Cheese网站获得的PPT资料,本文将对Snapdragon X2 Elite的微架构进行详细解析。

Oryon CPU集成了3个CPU集群:集群1和2各包含6个Prime核,集群3包含6个优化功耗面积的Performance核,总计18个核。高通命名的Prime核对应传统意义上的性能核(Performance Core),而Performance核则相当于能效核(Efficient Core)。这种设计避免了“大小核”的称谓,以提升市场形象。

整体来看,最高频率可达5GHz,基础频率为4.4GHz。每个集群共享16MB、16路L2缓存,共6个核。在自研核中,Apple和高通采用共享L2缓存,而Intel、AMD和ARM则使用私有L2缓存。

图片

图片

L2 Cache

L2缓存为16MB、16路共享设计,由6个核共享,平均每个核约2.7MB。与其他厂商的私有L2缓存(通常2~3MB)相比,共享缓存在活跃核较少时能提供更多可用空间,即使多核活跃也能避免多副本导致的利用率低下。然而,无冲突访问延迟较大,且在多核访问冲突时延迟可能恶化。因此,这种共享L2缓存在单核跑分中通常表现较高,但影响跑分的因素众多。

缓存一致性协议采用MOESI,与L1指令缓存(ICache)和数据缓存(Dcache)为包含关系。回填带宽为64B,由于共享设计,L1未命中、L2命中的延迟平均为21周期。

图片

Fetch & Decode

图片

Apple长期使用192KB缓存,高通基于历史原因也沿用此设计。分支预测器结构和共享L2缓存是主要原因,但分支预测器占主导。在算法优化中,分支预测是关键环节,高通前端设计有助于降低延迟。

前端包括1周期的next-fetch PC预测器(最小BTB,通常较小且用DFF搭建)、2周期的条件分支预测器(延迟较低,复杂算法通常需3周期),以及间接分支2周期延迟。分支预测错误惩罚为13周期,考虑到处理器频率较高,表现尚可。解码宽度为9。

Rename & Dispatch

重命名宽度与解码匹配,同为9。整数和向量有独立的物理寄存器文件,均超过400个。Checkpoint为常规技术支持。指令融合技术被广泛采用,多数核都会支持。每个周期可退休9个微操作(uOps),重排序缓冲区(ROB)有超过650个条目。

图片

Integer Execution

整数执行流水线为6宽、64位,通用寄存器(GPR)超过400个。每个周期最多处理6个微操作,包括4个分支和2个乘法/乘加(MUL/MLA)。分支执行单元可能为2个专用和2个复用流水线。延迟方面:ALU操作1周期,分支1周期,MUL/MLA 3周期。

图片

Vector & FPU & SIMD

图片

LSU

数据缓存(DCache)为完全一致性设计,大小96KB,缓存行64B。每个周期最多支持4个任意组合的加载或存储操作。支持存储-加载转发(store-load forwarding),当加载依赖未写入缓存的存储时,可直接从存储队列读取数据,显著降低延迟并提升性能。现代旗舰处理器普遍支持此技术。

加载队列有192个条目,存储队列56个条目。预取支持多种算法,如步幅(stride)和相邻行(adjacent line)预取。

图片

MMU

内存管理单元(MMU)支持4KB和64KB翻译粒度,但未支持ARM架构中的16KB粒度。虚拟化包括嵌套虚拟化,这在系统架构中常见,用于提升资源利用率。

L1指令TLB和数据TLB均为8路、256条目,L2 TLB为8K条目(目前已知厂商中最大)。典型的页表遍历缓存(PWC)技术也存在。此外,支持16个并行翻译请求,高于常见的4~8个,GPU通常更多。此模块面积开销不大,增加并行度有助于性能提升。

预取方面信息有限,但页表数据和页面预取是性能关键点。

图片

Performance Core

Performance集群同样包含6个核,优化了面积和功耗,频率降至3.6GHz,共享L2缓存缩减至12MB。各项参数均降低,公开结构显示面积约为Prime集群的一半多。

图片

图片

总结

Snapdragon X2 Elite微架构基本是前代的优化版本,宏观上没有激进变革。有趣的是,LSU和MMU部分的TLB数据不一致,可能是PPT基于前代修改未彻底所致。总体来看,高通的自研核已具相当水准,在缓存设计和分支预测等系统性能关键领域展现出竞争力。




上一篇:Langfuse实战:构建可观测的生产级AI应用,从诊断到部署
下一篇:PDF转Markdown高效工具Marker实战:学术论文与技术文档精准转换
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区(YunPan.Plus) ( 苏ICP备2022046150号-2 )

GMT+8, 2025-12-7 01:43 , Processed in 0.070616 second(s), 38 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2025 CloudStack.

快速回复 返回顶部 返回列表