苹果在昨晚低调宣布了搭载 M5 Pro 和 M5 Max 芯片的新款 MacBook Pro。作为当前模具的最后一代产品,并且在 M5 已经发布的前提下,许多人预测这一代的 MacBook Pro 在芯片上可能只是简单的核心堆叠,类似于从 M3 到 M4 Pro & Max 的升级路径。然而,发布后的仔细研究发现,苹果在这代可能“短命”的 M5 Pro & Max 芯片上,悄悄引入了几项重大创新,这或许是自 M1 以来 M 系列芯片架构变化最大的一次。
由于目前 M5 Pro & Max 的详细性能评测尚未解禁,官方公布的技术细节也有限,本文只能基于现有的信息进行推断和分析。但这并不太影响我们理解其变革的重点,因为 M5 Pro 和 M5 Max 的革新之处并不仅仅在于性能提升了多少。接下来,我们将逐一探讨它的几项关键变革。

1. 胶水封装与Chiplet设计
在 M5 系列发布之前,就有传闻称 M5 Pro 和 M5 Max 将采用全新的“胶水”芯片设计,并且允许 GPU 核心灵活搭配。从最终结果看,M5 Pro 和 M5 Max 的确采用了 Chiplet(小芯片)设计,但与传闻不同的是,它们共享了相同的 CPU 设计,而 GPU 部分则各不相同。

根据苹果官网的信息,可以明确推断出 Apple M5 Pro 和 M5 Max 至少是一个包含两个 Tile(芯片块)的 Chiplet 设计。第一个 Tile 是包含了 18 个 CPU 核心以及其他基础 SoC 功能的“SoC Tile”;第二个 Tile 则是一个拥有 20 个核心(M5 Pro)或 40 个核心(M5 Max)的“GPU Tile”。同时,根据它们的内存带宽推断,这一代 M5 Pro 和 M5 Max 的内存控制器很可能被放置在 GPU Tile 一侧,与 GPU 的规格强绑定。这种设计思路与 Intel Panther Lake 上区分大小核显的方案有相似之处。
根据 M5 Pro & Max 的内存带宽数据继续推断,M5 Pro 采用了 4 通道(256位)的 LPDDR5X-9600 内存,而 M5 Max 则采用了 6 通道(384位)和 8 通道(512位)的 LPDDR5X-9600。之所以推断内存控制器在 GPU 侧,除了规格绑定这个原因,更关键的是在 Chiplet 设计中,高带宽内存的跨 Die 通信代价比传统单芯片设计要大得多。GPU 是主要的内存带宽消耗者,如果内存控制器放在 CPU 侧,GPU 运算时的通信延迟和功耗会显著增加。反之,若放在 GPU 侧,虽然 CPU 访问内存需要“绕道”,但 CPU 本身对带宽的需求相对较低。另一个原因是,只有配备 40 核 GPU 的型号才有更高的内存通道配置,如果统一将控制器放在 CPU 侧,那么 M5 Pro 型号就会浪费不少硅片面积。

传闻中 M5 Pro 和 M5 Max 采用了台积电的 SoIC-MH 封装。这个名字容易让人联想到 AMD 在处理器上使用的 3D V-Cache 技术(SoIC)。但我有 95% 的把握断定,二者并非同一种东西,M5 Pro 和 M5 Max 不太可能采用 3D 堆叠封装。SoIC-MH 更可能是一种类似 Intel Foveros 的 2.5D 或 2.75D 封装技术,CPU 和 GPU Tile 处于同一个平面上,通过硅中介层(Interposer)互联,而非上下堆叠,否则散热将成为一个巨大的挑战。这种先进的封装技术是构建复杂芯片架构的基础。
2. M核心登场:CPU架构的再定义
M5 Pro 和 M5 Max 除了首次引入 Chiplet 设计,还首次引入了一个全新规格的核心类型。

在过去 M 系列的 SoC 上,一直采用与手机端 A 系列相同的 P 核(性能核心)搭配 E 核(能效核心)的配置。苹果的 E 核虽然 IPC(每时钟周期指令数)不俗,但其频率始终是短板,绝对性能不算很高。

而在 M5 Pro 和 M5 Max 上,苹果虽然继续保持大小核设计,但此时的小核心已经不再是过去的 E 核(能效核),而是一个全新的“M 核心”。相应地,苹果也将过去的 P 核(性能核心)改名为“超级核心”,新的 M 核则称为“性能核心”。根据目前的信息,这个 M 核心类似于 ARM 的 Cortex 系列设计思路,是从顶级核心(P核)上通过阉割部分规格衍生而来的中端核心。值得一提的是,未来 Intel 在推行“统一核心”(Unified Core)战略后,其大小核架构可能也会采用类似方式。下图展示了 M4 Max 的 CPU 核心架构,可以作为参考。

然而,尽管 Apple 用更强的 M 核心替换了 E 核心,但也同时削减了 P 核心的数量。M4 Pro 是 10P+4E 的规格,M4 Max 是 12P+4E 的设计。但到了 M5 Pro 和 M5 Max,则变成了 6P+12M 的规格,P 核心的数量被大幅削减,特别是在 Max 型号上几乎腰斩。

因此,综合来看,Apple 这次核心架构的变化主要目的可能并非为了大幅提升峰值性能,而更多是出于优化芯片面积和成本考虑。从苹果官方给出的 M5 Max 与 M4 Max 在代码编译等通用任务上的性能对比来看,提升大约在 10% 左右,并不算非常显著。至于 P 核和 M 核的具体面积比例,还需要等待芯片的 Die Shot 照片公布后才能知晓。
3. AI能力的持续增强
最后聊聊一个相对不算太新(相对于 M5)但依然重要的亮点:Apple 在 M5 这一代显著增强了 GPU 的设计,大幅强化了 AI 处理能力。

因此,可以看到 M5 Pro 在一些特定的 LLM(大语言模型)任务上,例如“首个词元响应速度”,相比 M4 Pro 有数倍的提升。但需要注意,这可能是由于特定硬件单元(如神经网络引擎)的优化带来的特性提升,并不代表在所有类型的 AI 或 LLM 任务上都有同等幅度的进步。在 AI 应用日益本地化的今天,M 系列芯片凭借其统一内存架构、高能效比和强大的计算能力,非常适合个人开发者或用户在本地运行 AI 模型。

至于 M5 Pro 真实的 AI 综合能力如何,我们可以参考采用相同 GPU 架构的 M5 芯片的表现。根据一些第三方测试,M5 的 AI 实际性能提升大约在 30-40% 之间。那么,M5 Pro & Max 相对于 M4 Pro & Max 的提升幅度应该大致相当。在内存规格没有发生质变的前提下,这个表现已经相当不错。

小结
等到 M5 Pro 和 M5 Max 的更多技术细节和性能评测解禁后,我们或许能进行更深入的分析。在 M5 Pro 和 M5 Max 之后,人们更期待的是 M6 系列芯片与全新模具的 MacBook Pro 的组合。如果届时能搭载 LPDDR6 内存,或者位宽大幅增加的 LPDDR5X 内存,其性能表现将更值得期待。