据英特尔在 Computex 2026 上的发布会透露,传统 AI 推理流程相对单一,但具备自主决策能力的代理式 AI(Agentic AI)却是另一套运作逻辑。Agentic AI需要调用各类工具处理数据、读写文件、验证规则,而这些任务多数由 x86 架构的 CPU 承担。
在传统 AI 推理中,GPU 与 CPU 的使用比例约为 7 比 1;而在基于智能体的 Agentic AI 里,因为涉及更多代码编译与测试任务,GPU 和 CPU 的比例将变为 1 比 1.3。换句话说,CPU 在 Agentic AI 场景里的地位将显著提升。
值得一提的是,英伟达也在加大对数据中心 CPU 的投入,推出 Vera CPU。CEO 黄仁勋指出,进入 Agentic AI 时代,CPU 已成为限制 GPU 发挥的瓶颈,CPU 未来将成为公司新的主要增长引擎。
伴随 Agentic AI 的普及,长期被忽视的 CPU 正在获得新定位,算力结构也将迎来新变化。对国产 CPU 厂商而言,这是否意味着新的市场窗口期已经打开?
Agentic AI 为什么需要更多 CPU
从本质上看,Agentic AI 相当于一个虚拟项目经理。传统生成式 AI 需要用户输入具体指令来执行特定任务,而 Agentic AI 只需你描述想要达成的目标,就能理解需求,自主“组建团队、分配任务”,协同多种 AI 能力完成复杂工作并交付。
从计算的视角看,传统生成式 AI 接收输入后,由 GPU 负责高强度的矩阵乘法推理,算出结果即告结束。Agentic AI 作为“项目经理”,则需要自主规划、调用工具、反思迭代、多智能体协同,这种运行模式意味着系统可能同时启动多个并发进程——比如多个智能体协同处理复杂任务。
此时,CPU 的多任务处理能力就变得至关重要。如果并发的智能体进程数远超 CPU 物理核心数,CPU 必须频繁进行上下文切换。频繁的切换会迅速耗尽 CPU 资源,系统的吞吐量瓶颈往往卡在 CPU 的调度能力上,而非 GPU 的算力。
此外,GPU 擅长大规模、高密度的并行矩阵计算,却在条件分支(If-Else)、循环、树状搜索和复杂逻辑面前力不从心。这些恰恰是 CPU 的强项——Agentic AI 依赖的是 CPU 提供的低延迟逻辑计算、分支预测和缓存一致性能力。尤其是未来物理 AI 在现实世界执行动作时,低延迟会变得更加重要。GPU 虽然吞吐量高,但其上下文切换和指令分支的延迟较大,不适合低延迟控制逻辑。
因此,随着 Agentic AI 的进一步普及,CPU 的需求将大幅提升。英特尔 2026 年一季度财报中,CFO David Zinsner 明确表示:随着工作负载向推理和 Agentic AI 迁移,CPU 与 GPU 的比例可能收敛至 1:1,甚至 CPU 需求超过 GPU。这一转变已导致服务器 CPU 价格上涨 10%—20%,交货周期延长至约 6 个月,未满足的需求将“以十亿美元计”。
针对高并发 Agent 负载,CPU 架构发生转变
从多家厂商的动作来看,英伟达在今年 3 月的 GTC 上发布了 Vera CPU,专为代理式 AI 和 AI 工厂的 CPU 密集型工作设计,配备 88 个定制 Olympus ARM 核心,支持多线程技术至 176 线程,通过 NVLink-C2C 总线实现 1.8TB/s 带宽连接,拥有 1.2 TB/s 的内存带宽。同时,Vera CPU 将作为独立产品销售,而非强制捆绑 Rubin GPU 等产品,这进一步凸显了 CPU 的战略地位。
同样在今年 3 月,Arm 发布了公司历史上第一款对外销售的自研芯片——AGI CPU,单芯片集成 136 个 Neoverse V3 核心,全核 3.2GHz,最高加速 3.7GHz;内存支持 12 通道 DDR5-8800,每核独享 6GB/s 带宽,延迟 <100ns;提供 96 通道 PCIe Gen6,支持 CXL 3.0。
该芯片在高密度部署上也有不小亮点:在标准 36kW 风冷机架中可部署约 8160 核;在液冷环境下单架可扩展至 336 颗芯片、超 45000 核,计算密度相比 x86 平台提升 2 倍以上。
顾名思义,Arm AGI CPU 就是为 Agentic AI 打造的,Arm 将其定位为异构架构中的“主控层”——GPU 负责模型执行,AGI CPU 负责系统编排。从产品名称到架构定义,都能看出 Arm 押注“Agentic AI 将重构数据中心 CPU 需求”的决心。
AMD 在今年 5 月官宣 Venice 系列服务器 CPU 进入量产爬坡阶段。根据之前透露的消息,AMD 专为 Agentic AI 时代的高并发轻线程负载推出了 Venice Dense,这是第六代 EPYC 服务器 CPU 的高密度核心版本。Venice Dense 采用 Zen 6c 高密度核心架构,基于台积电 N2 工艺,提供 256 核心、512 线程。单芯片集成 8 个 CCD,每个 CCD 32 核,还配备高达 1GB 的 L3 缓存(每 CCD 128MB,每核 4MB)。未来作为 Helios 机架级 AI 平台的核心,Venice Dense 将与 MI400 GPU 形成 CPU 编排和 GPU 推理的异构闭环。
总体来看,Agentic 负载的 CPU 利用率特征不是持续满载,而是高频突发以及大量空闲等待,因此 Agentic AI 对 CPU 的需求,从过去强调单核性能优先,转变为高并发调度优先。这样的变化或许会给 CPU 市场带来全新格局。
从核心数量上也可以看到趋势:Arm AGI CPU 采用了 136 个 Neoverse V3 核心,AMD 的 Venice Dense 更是达到 256 核 Zen 6c,Chiplet 和多芯粒设计正在成为主流,通过模块化扩展核心数。
近年来,基于 Arm 的服务器处理器市场份额不断提高,2025 年全年渗透率已超过 20%。中国移动近期宣布启动 2026 年至 2027 年 PC 服务器产品集中采购项目,其中 Arm 架构服务器的占比高达 65%。对于国内大多采用 Arm 架构的服务器 CPU 厂商而言,Agentic AI 的趋势很可能是一次全新的市场窗口期。相比传统的 x86 架构,Arm 在核心设计、延迟、功耗等方面有更大的灵活性,能够更好地针对不同应用进行优化设计。
国内外云服务巨头自研芯片几乎都采用 Arm 架构,部分也会选择更加开放的 RISC-V 架构。国内服务器 CPU 厂商,包括华为鲲鹏、飞腾、阿里平头哥、鸿钧微等目前都已经推出基于 Arm 架构的服务器 CPU 并广泛应用。此前瑞银在报告中预测,随着 Agentic AI 的落地,Arm 在服务器 CPU 市场的份额有望在 2030 年提升至 40% 到 45%。
当然,x86 阵营的英特尔和 AMD 也没有闲着。AMD 在针对 Agentic AI 应用设计的 Venice Dense 上,采用了针对高密度计算优化的 Zen 6c 内核,相比 Zen 6 的单核面积缩小 30%;CCD 内部采用 4×8 网格拓扑,提供更低的延迟;适当缩减了浮点和向量单元,换取更多核心面积。这证明 x86 CPU 通过架构优化同样能够适配 Agentic AI 应用。
小结
Agentic AI 并没有让 CPU 变得像 GPU,而是让 CPU 重新找回了自己的不可替代性。CPU 与 GPU 的需求比例将发生巨大变化,最终可能接近 1 比 1。随着英伟达、Arm 的亲自下场,以及国内 Arm CPU 厂商的崛起,服务器 CPU 市场又将迎来一波大变局。