在人工智能推理芯片产业链中,从上游的IP/EDA工具,到中游的芯片设计,再到下游的制造封装与终端应用,形成了完整的生态链条。以下是产业链的详细结构:
AI推理芯片产业链
│
├── 上游:芯片设计IP/EDA工具
│ ├── ARM架构授权(全球)
│ ├── 新思科技/楷领科技(EDA)
│ └── ImGPU/芯动科技(GPU IP)
│
├── 中游:AI推理芯片设计
│ ├── 通用GPU(训练+推理):海光信息DCU、寒武纪MLU、摩尔线程GPU、沐曦股份GPU
│ ├── NPU/ASIC(专用推理):华为昇腾(非上市)、寒武纪(已上市)
│ └── SoC芯片(含AI加速):晶晨股份、瑞芯微、全志科技
│
├── 下游:芯片制造与封装
│ ├── 芯片制造:台积电(境外)、中芯国际(国内)
│ ├── 封装测试:通富微电、长电科技、华天科技
│ └── 先进封装:甬矽电子、伟测科技
│
└── 终端:服务器/云厂商
├── 浪潮信息(服务器)
├── 中科曙光(超算)
└── 拓维信息、软通动力(华为昇腾服务器)
推理芯片 vs 训练芯片的技术差异
| 维度 |
训练芯片 |
推理芯片 |
| 算力需求 |
超大算力(TFLOPS级) |
中等算力(TFLOPS级) |
| 内存带宽 |
极高(TB/s级) |
中等(TB/s级) |
| 能效比 |
相对较低 |
极高(专用优化) |
| 延迟要求 |
不敏感 |
极敏感(实时响应) |
| 代表性产品 |
英伟达H100/H800、海光DCU |
华为昇腾310、寒武纪MLU370 |
| 市场格局 |
英伟达绝对垄断(90%+) |
百花齐放,国产占比提升 |
| 名称 |
涨幅% |
现价 |
换手率% |
主力净流入(万) |
成交额亿 |
所属概念 |
| 海光信息 |
+4.64 |
275.63 |
2.33 |
113,135 |
152.61 |
AI芯片/DCU |
| 寒武纪 |
-0.25 |
1319.64 |
— |
— |
167.61 |
AI芯片 |
| 摩尔线程 |
-0.10 |
605.00 |
14.30 |
21,747 |
26.19 |
AI芯片/GPU |
| 沐曦股份 |
-0.50 |
666.67 |
25.86 |
17,007 |
32.37 |
AI芯片/GPU |
| 晶晨股份 |
+0.72 |
86.80 |
4.93 |
22,785 |
18.52 |
AI SoC |
| 润和软件 |
+2.11 |
43.00 |
11.40 |
36,543 |
39.85 |
鸿蒙/DeepSeek |
| 软通动力 |
+0.82 |
42.90 |
5.20 |
10,213 |
17.75 |
昇腾/DeepSeek |
| 拓维信息 |
-1.02 |
37.83 |
19.01 |
65,564 |
85.14 |
昇腾服务器 |
| 力源信息 |
-0.61 |
12.99 |
18.52 |
46,889 |
25.98 |
芯片分销 |
| 卓易信息 |
+1.65 |
121.00 |
6.62 |
13,554 |
10.00 |
云计算/AI |
推理概念核心公司
寒武纪(芯片设计、云边端一体化AI芯片旗舰)
寒武纪是中国最纯粹的独立AI芯片设计公司,自研MLU架构,覆盖云-边-端全场景。思元590(7nm,FP16算力314 TFLOPS)是核心旗舰产品,对标国际主流方案。已基于vLLM推理框架完成DeepSeek-V4系列Day 0适配,表明公司在推理生态上的深度卡位。R1已验证"算法红利",V4的国产适配相当于算法红利+硬件红利双重叠加。DeepSeek-V4发布后,寒武纪同步实现软硬件协同。市值已达5703亿,市场给予极高预期溢价。
风险提示:估值极高(PE-ttm约277倍);软件生态(BANG)相较CUDA仍有差距;研发与扭亏仍处于投入期。
海光信息(芯片设计、CPU+DCU双剑合璧,国产替代主线索)
海光是国产x86架构CPU绝对龙头,产品对标英特尔至强。同时布局DCU(深度计算处理器),采用与CUDA兼容的ROCm路线,兼具CPU(通用计算)+DCU(AI加速)双能力,AI训练/推理双适配。DCU深算系列与365款主流大模型完成适配,覆盖全球99%非闭源模型。通过软件兼容降低了客户迁移成本,形成独特竞争壁垒。2025年营收143.77亿元(同比+56.92%),归属净利润25.42亿元。2026年Q1营收40.34亿元(同比+68.06%)。总市值6624亿元。
澜起科技(芯片设计、AI数据洪流的"高速公路")
全球领先的内存接口芯片公司,与IDT(瑞萨)、Rambus三分天下。核心产品为DDR5 RCD(寄存时钟驱动器)芯片及配套DB芯片,解决CPU与内存之间的高速数据传输瓶颈。AI推理需要海量数据处理,大数据吞吐量推动内存接口带宽需求(DDR5→DDR6),澜起作为全球仅三家能提供全套内存接口解决方案的公司之一,竞争格局极优。同时布局PCIe Retimer、CXL互连等AI基础设施关键互连技术。总市值1998亿元,2026年2月在香港联交所主板挂牌上市(港A双挂牌),国际资本通道打开。
中芯国际(晶圆制造、国产芯片不可替代的制造底座)
中国大陆技术最先进、规模最大的晶圆代工企业,已量产14nm,N+2(7nm级)稳步推进。摩根士丹利看好中芯国际本土供给能力,认为N+2节点是2025年国产AI芯片生产的关键技术点,N+3(5nm)节点将进一步增强本土供给能力。所有国产推理芯片设计公司最终都需要制造落地,制造是中国半导体产业链最薄弱的环节,中芯国际是其中最核心的战略性资产。
盛科通信(芯片设计、超节点最具弹性的纯正标的)
国内领先的以太网交换芯片设计企业,产品覆盖从100Gbps至2.4Tbps交换容量。在超节点柜内,计算节点之间需以Scale-up高速互联,盛科的交换芯片是核心价值环节。超节点机柜新增Scale-up域,带来交换芯片及交换节点需求,盛科作为国产交换芯片稀缺标的,短期业绩弹性最大。本周股价涨幅19.06%,盘中触及近一年最高价288.8元。
芯原股份(IP授权+芯片定制、ASIC时代最大的"淘金卖铲人")
国内唯一同时具备全栈半导体IP授权与一站式芯片定制能力的平台型企业,IP授权市占率中国内地第一、全球第八。2026年前4月新签订单45.16亿元(超2025全年营收),AI算力相关占比超85%,绝大多数来自云端AI ASIC及IP领域。互联网大厂和云服务商正从"买GPU"转向"定制ASIC",芯原承接设计服务和IP授权,与IPnest统计的全球IP排名提升相匹配(已升至全球第六),也是福布斯中国认证的产业链核心标的。订单能否顺利转化为量产收入存在不确定性;当前市值1203亿元,已反映较高的增长预期。
云天励飞(芯片设计、纯推理芯片标的,云边端全场景卡位)
以NPU为核心,在云推理场景确定GPNPU技术路线,深度优化矩阵单元和存储层级,标志性动作是"全面聚焦AI推理芯片",围绕边缘计算、云端推理、具身智能三大核心布局。DeepEdge10——国内首创的国产14nm Chiplet大模型推理芯片,采用自主可控国产工艺,内置国产RISC-V核,支持大模型推理部署。2025年营收13.08亿元(同比+42.57%);总市值332亿元。体量相对较小,营收基数不大;目前仍处亏损阶段,关注营收增速能否持续弯道超车。
浪潮信息(服务器整机、推理服务器放量的直接受益者)
国内最大的AI服务器供应商之一,拥有JDM(联合开发制造)模式与国内头部客户深度绑定。元脑R1推理服务器可单机部署DeepSeek-671B模型;元脑CPU推理服务器则覆盖DeepSeek-R132B等新一代推理模型。超节点放量直接拉动整机需求,作为核心ODM厂商,将享受行业系统级扩张带来的增长机遇。毛利率较低(规模化制造企业属性),跟踪订单和出货量是关键。
恒烁股份(芯片设计·LPU存算一体概念,弹性标的)
SRAM存算一体推理芯片已量产(LPU路线),适配国内大模型,低延迟、低功耗。相较于传统冯·诺依曼架构,存算一体天然切中推理任务的核心诉求。2026年Q1营收同比+192.08%,Q1净利润4863.66万元,从芯片出样的"0→1"阶段跨入小规模放量的"1→N"临界点。总市值约79亿元。市值和营收规模均较小,股价波动率大。是否存在大客户绑定需持续验证。
长电科技(封装测试·Chiplet+3D封装的确定受益者)
全球封测龙头之一,直接承接LPU及多种AI芯片的先进封测订单(Chiplet+3D先进封装)。推理芯片多样化(ASIC、LPU、NPU等不同架构)带来大量定制化封装需求,Chiplet路线可显著降低单芯片设计和制造成本。长电的弹性取决于国产推理芯片的真实放量速度。
昇腾 950PR 供应链
推理 #芯片 #昇腾
内容来自于网络。本文仅供信息交流、学习参考及讨论之用,不构成任何投资建议。资本市场存在风险,投资需谨慎。