找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

3891

积分

0

好友

507

主题
发表于 3 小时前 | 查看: 3| 回复: 0

一、前言:AI算力浪潮下的蓝厂新旗手

2026年的专业AI算力卡市场,依然呈现出清晰的三足鼎立格局:NVIDIA凭借Blackwell架构在高端数据中心与专业工作站市场占据绝对主导地位,凭借完整的CUDA生态与成熟的软件适配构筑了深厚壁垒;AMD则依靠Instinct系列加速卡稳步追赶,在开源计算与超大规模部署场景中持续扩大份额;而英特尔则走出了差异化路线,聚焦工作站级本地AI推理、专业图形与内容创作场景,凭借Xe2架构、开放的oneAPI生态与大显存配置,为用户提供高性价比的本地化算力方案。

随着本地大模型部署、AI内容生产、三维设计等需求的爆发,市场对大显存、高稳定性、强兼容性的专业算力卡需求日益高涨。正是在这样的背景下,基于全新BMG-G31核心的Arc Pro B70正式登场,成为英特尔征战专业显卡市场的旗舰级产品。

英特尔ARC PRO系列显卡宣传图

而本次我们拿到的这款产品,来自英特尔显卡在中国大陆的核心合作伙伴——蓝戟(GUNNIR)。其英文名GUNNIR源自北欧神话中主神奥丁的“永恒之枪”Gungnir,传说这柄神枪百发百中、可穿透一切障碍,蓝戟也以此为寓意,以锐利的产品力在显卡市场开辟了蓝色赛道。

GUNNIR品牌标志

蓝戟始终专注于Intel Arc显卡的研发与制造,从初代Alchemist架构到如今的Battlemage架构,蓝戟始终紧跟英特尔的产品节奏。这款GUNNIR Arc Pro B70 TF 32G,正是其面向专业工作站市场打造的旗舰型号。

蓝戟GUNNIR品牌显卡

二、显卡本体:全黑工业风设计,均热板加持的涡轮散热方案

外包装:简约环保,参数一目了然

蓝戟Arc Pro B70 TF采用了简约的牛皮纸环保包装,没有花哨的视觉装饰,完全延续了专业硬件的务实风格。包装盒正面直接印出了两项核心规格:32GB显存容量与367 TOPS的AI算力。

包装盒正面

这里需要特别说明:包装上标注的367 TOPS为INT8整数精度下的峰值算力,与NVIDIA Blackwell架构显卡标注的FP4浮点精度算力并非同一计量标准,二者无法直接进行数值换算。INT8算力主要对应主流大模型推理、AI图像生成等量化场景,是当前本地AI部署中最常用的精度,而FP4属于极低精度浮点,更多用于特定超大规模模型的推理场景,不同精度下的算力数值不具备直接横向可比性。

包装盒背面

包装盒背面则标注了更多核心特性:PCI-E 5.0 X16接口、原生Linux系统支持、多GPU协同扩展、608GB/s显存带宽,清晰呈现了这款专业卡的核心能力。

显卡背板

外观设计:双槽结构,工业质感拉满

取出显卡本体,通体纯黑的外观延续了专业卡一贯的低调沉稳风格,无多余灯效装饰,一切设计均服务于功能。

显卡侧面

显卡外壳采用上下双层结构设计:远离PCB的上盖为塑料材质,表面布满细密的锉刀状纹理,在一定程度上提升了显卡的质感,也能避免指纹残留,在硬朗的工业风中增添了细节质感;靠近PCB的一层为金属中框,既起到加固PCB、防止长期使用变形的作用,也能辅助供电与显存元件散热。

显卡正面

显卡正面与金属背板上均印有GUNNIR品牌LOGO,侧面则清晰印有“ARC PRO B70”的型号标识,辨识度极高。

显卡侧面特写

接口与供电:双8pin设计,务实兼容

供电方面,显卡采用双8pin供电设计,相比NVIDIA近年来的 12V-2×6 16pin接口,双8pin在工作站电源、老旧电源上拥有更好的兼容性,无需额外转接线即可直接部署。

显卡尾部接口

显卡为标准双槽厚度,采用涡轮式散热方案,三围分别是26.7×111.1×37.3mm,整体高度不越肩。供电接口设计在显卡尾部,且尾部预留了专用螺丝孔位,可加装显卡支架,完美适配各类工作站机箱、服务器机箱,多卡并排安装时也不会互相干涉。

显示输出接口

显示输出接口采用3个DP 2.1+1个HDMI 2.1的组合,相比纯DP接口的专业卡方案,对普通消费级显示器更加友好,兼顾了专业显示器与家用显示器的连接需求。

显卡背板结构

显卡配备全金属背板,既可以为PCB提供物理支撑,避免长期使用弯曲变形,也能通过导热垫为背面显存、供电元件辅助散热。PCI-E接口金手指为满配规格,支持PCI-E 5.0 X16总线,带宽相比ARC PRO B60实现带宽翻倍,为高端工作站的多卡协同、大数据量传输提供了充足带宽。

金手指接口特写

电路板特写

内部散热:均热板方案,细节拉满

卸下上盖与金属背板后,可以看到这款显卡的散热系统并没有采用常见的热管方案,而是使用了成本更高、均热效果更好的VC均热板作为核心导热底座,能够将GPU核心的热量快速均匀地扩散到整片鳍片上,更适合长时间满负载的工作站场景。

显卡拆解部件

即便是尾部的狭小空间,蓝戟也没有浪费,额外塞入了一小块辅助鳍片,进一步提升散热面积,优化尾部元件的散热效果。

散热组件特写

内部散热风扇

显卡尾部电源接口

显卡共搭载16颗三星GDDR6显存颗粒,PCB正面与背面各布置8颗,共同组成32GB总容量、256bit显存位宽的规格,对应608GB/s的理论显存带宽。

显存颗粒特写

这组显存支持ECC错误纠错功能,可在长时间高负载的专业计算、AI推理场景下有效降低数据传输出错概率,保障7×24小时运行的稳定性与数据准确性,也是专业工作站显卡区别于消费级显卡的核心特性之一。

PCB板显存颗粒

这款显卡的设计思路非常清晰:完全围绕7×24小时稳定运行的工作站需求打造,在标准双槽的体积内,通过均热板+涡轮风扇的组合保障散热,同时兼顾多卡兼容性、供电兼容性与扩展能力,是典型的“功能优先”专业卡设计。

三、基础性能测试:BMG-G31首秀,图形性能跨代提升

BMG-G31核心:千呼万唤始出来的Xe2大核心

Arc Pro B70搭载的BMG-G31 GPU,是英特尔Battlemage(战斗法师)架构的旗舰级大核心,也是传闻已久、历经多次跳票后终于落地的产品。

GPU-Z规格信息

该核心采用台积电5nm工艺制造,核心面积368平方毫米,集成277亿个晶体管,配备24MB L2缓存。完整规格下拥有32个Xe2核心、4096个流处理器、32个光线追踪单元以及256个XMX AI引擎,相比前代Arc Pro B60搭载的BMG-G21核心(20个Xe核心、196亿晶体管、18MB L2缓存),规模大幅提升了60%。

多款显卡规格对比

除了图形与AI计算能力的升级,BMG-G31还带来了完整的PCI-E 5.0 X16总线支持、更强的AV1编解码能力,以及针对专业软件优化的ISV认证驱动,全面覆盖3D设计、视频剪辑、AI推理等专业工作流。接下来我们将使用Intel Core Ultra 7 270K PLUS搭配 32GBx2 的 DDR5-6400 内存进行测试。

3DMark 基准测试:大幅超越前辈,逼近主流高端游戏卡

我们使用3DMark对显卡进行了基准性能测试。结果显示,蓝戟Arc Pro B70在Time Spy、Fire Strike Extreme等经典测试项目中,相比先前发布的Arc Pro B60提升幅度均超过50%,而在4K光追Steel Nomad测试中提升幅度更是超过60%,基本符合两者在GPU方面的规格差距,充分展现了BMG-G31核心的图形潜力。而相比RTX 5070则全面落后,在DX11测试项目Fire Strike Extreme中明显落后约20%;而在DX12的Time Spy测试中落后幅度缩减为10%左右,4K光追Steel Nomad测试落后幅度又扩大到15%,这也再次印证了Intel Arc系列显卡DX12表现优于DX11,光栅表现优于光追的特点。

3DMARK性能测试对比

游戏性能:2K畅玩主流游戏,XeSS助力4K体验

在《古墓丽影:暗影》这款较老的3A游戏中,蓝戟Arc Pro B70在2K画质下可以轻松超过144帧,完全满足部分高刷新率显示器的需求。而开启XeSS性能档之后,更是可以冲到200帧以上。

古墓丽影:暗影帧率测试

在一款较新但对显卡性能要求并不算高的游戏《席德·梅尔的文明 VII》中,蓝戟Arc Pro B70在2K画质下平均帧率依然可以超过200 FPS。

席德·梅尔的文明 VII帧率测试

而在虚幻5引擎开发的《黑神话:悟空》这类对硬件要求极高的3A大作中,蓝戟Arc Pro B70的表现就没那么亮眼了,2K最高画质下仅能维持30帧左右。

黑神话:悟空帧率测试

虽然定位专业工作站卡,但得益于完整的游戏驱动支持,Arc Pro B70在游戏中的表现同样可圈可点。2K下大部分游戏均可畅玩,而开启英特尔XeSS超分辨率技术后,即便在4K分辨率下也能获得可玩的游戏帧率,兼顾了专业工作之余的游戏需求。

专业图形性能:SpecViewPerf跨代跃升,ISV认证加持

在面向专业设计的SpecViewPerf 15测试中,蓝戟Arc Pro B70相比Arc Pro B60提升幅度基本在50%-70%之间,而在SolidWorks测试中成绩翻了一倍还多。在部分工业设计、三维建模测试项目中,性能甚至大幅领先RTX 5070;而在 Unreal Engine 这类更多考验3D性能的测试中,则是RTX 5070拥有更多优势。

SPECVIEWPERF性能测试对比

这一优势离不开英特尔针对专业软件的ISV认证与驱动优化。针对 AutoCAD、SolidWorks、Maya 等主流专业软件,Arc Pro 系列显卡均有专属的驱动优化,能够提供更稳定的运行表现与更高效的渲染效率,这也是专业显卡相比消费级显卡的核心价值之一。

四、AI 性能测试:32GB 大显存加持,本地推理优势显著

对于专业工作站显卡而言,AI 性能已经成为与图形性能同等重要的核心指标。我们分别从本地大语言模型推理、ComfyUI 图像与视频生成两个维度,对 Arc Pro B70 的 AI 能力进行了测试。

本地大语言模型推理:大显存解锁大模型

我们在Windows下的LM Studio,使用Vulcan API进行推理测试。

GPT-OSS-20B模型推理性能对比

首先测试一个参数量达到20B的MOE模型:GPT-OSS 20B。因为是MOE模型,对显存需求相对较低,三张显卡同样能够满足。蓝戟Arc Pro B70在F16精度下领先RTX 5070约10-20%,而精度降到INT4后,领先幅度甚至超过50%。

QWEN3.5 9B模型推理性能对比

接下来是一个小参数的稠密模型:QWEN 3.5 9B。在这个模型中,F16精度显存消耗已经超过12GB,RTX 5070因为显存溢出只能使用内存进行推理,速度下降到了一位数;而Arc Pro B60因为算力有限,即使显存够用,速度也不够看。蓝戟Arc Pro B70在F16精度下大幅领先另两者。

QWEN3.5 27B模型推理性能对比

再下来是一个中等参数规模的稠密模型:QWEN 3.5 27B。这个模型的F16精度已经超过32G显存,三张卡都不够,所以就只测了INT8和INT4两个精度。而即使是24GB的Arc Pro B60也只能使用INT4精度。Arc Pro B70配备的32GB带ECC纠错功能的GDDR6显存,其优势在此时尽显无疑。

任务管理器GPU占用

而在测试过程中也发现了一些问题,Arc Pro B70在LM Studio中,默认情况下有概率会出现不能把全部模型加载到GPU中的情况,这时需要手动调整GPU Offload才可以实现最佳性能。

ComfyUI图像与视频生成:高素质无压力

其实当初在测试Arc Pro B60的时候就有所感觉,ComfyUI对Intel Arc显卡的支持是要优于Ollama、LM Studio这类推理框架的,这也使得Arc Pro B70在图像、视频内容生成方面更容易发挥水平。

在Z-Image-Turbo中,蓝戟Arc Pro B70显卡凭借大显存,可以使用最高精度的BF16模型,使用ComfyUI默认工作流生成一张 1024×1024 分辨率的图像仅需8秒左右,而同样情况下的B60则要超过12秒。

ComfyUI文生图执行耗时

而在WAN 2.2视频生成中,32G显存的蓝戟Arc Pro B70可以支持一次性生成6秒的720p分辨率视频,两次采样总耗时大约8分钟左右。

ComfyUI视频生成加载日志

32GB大显存的优势使得其能够使用更高精度的模型,生成更高分辨率的图像和一次性生成更长时间的视频,整体工作流效率显著提升。如果你对Stable Diffusion这类AI图像生成工具感兴趣,大显存显卡无疑是提升创作效率的关键。

五、噪音与散热测试:高转速换低温,纯工作站向调校

我们通过3DMark压力测试对显卡的散热与噪音表现进行了持续满载测试。在大约20分钟的压力测试过程中,Arc Pro B70显卡的GPU频率基本稳定在 2650-2700MHz,偶尔会冲到2800MHz。

3DMARK压力测试GPU频率

功耗长时间稳定在290W,可见蓝戟这张卡是按照Intel Arc Pro B70的最高规范配置TBP的,从而使得BMG-G31核心能够发挥最大性能。

3DMARK压力测试功耗

在温度方面,GPU稳定在70度上下,显存稳定在73-75度,可以说是一个非常良好的工作状态。GPU能够持续稳定在高频率运行,不会因为过热出现降频,完全满足7×24小时的工作站负载需求。

3DMARK压力测试温度

而这一切的代价是风扇转速,双槽涡轮风扇在应对接近300W的功耗时显得非常吃力,峰值转速超过5500 RPM,满载时的噪音表现相当突出,堪比“火箭升空”,完全不适合在安静的家庭、普通办公室环境中使用。但对于机房、工作站机柜这类本身对噪音不敏感、且优先保障稳定性的场景,这种高转速、强散热的调校反而是优势,因为能够最大限度保障显卡在长期满负载下的可靠性与性能一致性。

3DMARK压力测试风扇转速

六、总结:大显存专业算力卡的高性价比之选

蓝戟Intel Arc Pro B70 TF 32G是一款定位非常清晰的工作站级专业显卡。它以BMG-G31核心为基础,兼顾了不错的图形性能与强劲的AI算力,而32GB ECC大显存、PCI-E 5.0、多GPU支持、ISV认证等特性,都精准命中了专业用户的痛点。

这款显卡目前的售价大约在9000多元,与NVIDIA RTX 5080实际成交价格差不多。而对于需要本地部署大模型、进行AI内容创作、从事3D设计与视频后期的专业用户而言,这款显卡提供了相比同价位竞品更大的显存和更小的体积,在多卡堆叠的工作站场景中拥有很高的性价比。当然,涡轮风扇的高噪音也决定了它并不适合普通家用游戏用户,其最佳舞台依然是服务器与工作站机柜。

本次我们仅对这款显卡进行了基础的性能、AI与散热测试,后续我们还将针对它在视觉内容生成、智能体应用等更多专业场景下的表现进行更详尽的深度测试,敬请持续关注。如果你对模型训练深度学习等领域有更多兴趣,欢迎常来云栈社区交流探讨。




上一篇:物理 AI 如何重塑自动驾驶与机器人平台?
下一篇:微软Exchange权限提升漏洞PoC公开:SSRF导致任意文件读取
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-6-27 04:17 , Processed in 0.778942 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表