5198 积分	0 好友	718 主题

发消息

Qwen3.5小型模型开源：0.8B到9B四款，性能比肩大模型并支持端侧部署

发表于 2026-3-4 08:31:28 | 查看: 88| 回复: 0

昨日晚间，阿里巴巴Qwen团队正式开源了Qwen3.5小型模型系列，包括Qwen3.5-0.8B、Qwen3.5-2B、Qwen3.5-4B和Qwen3.5-9B四款尺寸。该系列模型专为端侧设备设计，可在消费级硬件上运行。

Qwen团队在社交平台X上发布新模型的推文

模型发布后迅速引发技术社区热议。特斯拉CEO埃隆·马斯克也现身评论区，并留下了“Impressive intelligence density”（令人惊叹的智能密度）的评价。

埃隆·马斯克在相关推文下的评论截图

性能基准：小模型，大能耐

根据官方发布的基准测试结果，Qwen3.5-9B在多项关键评测中表现突出。

Qwen3.5-9B与4B在多任务基准测试中的得分柱状图

在指令跟随（IFBench）、研究生水平推理（GPQA Diamond）、数学竞赛（HMMT）、视觉推理（MMMU-Pro）等多个维度上，Qwen3.5-9B的表现超越了GPT-OSS-20B、GPT-5 nano、Gemini 2.5 Flash-Lite等知名模型，甚至在某些任务上领先于参数量大得多的自家前辈模型（如Qwen3-Next-80B）。

作为更小的版本，Qwen3.5-4B的表现也已接近9B模型，在多语言知识、视觉推理、文档理解等任务上可与更大模型媲美，但在纯数学推理等复杂任务上存在差距，这也是小规模模型的普遍挑战。

模型定位：从边缘设备到轻量级智能体

该系列所有模型均基于统一的Qwen3.5基座架构开发，采用Apache 2.0协议开源，支持商用，并允许进行LoRA或全量微调。其设计目标明确，旨在以更少的计算资源提供可用的智能：

0.8B/2B版本：主打小巧与高速，是移动设备、IoT边缘设备部署以及需要低延迟实时交互场景的首选。
4B版本：具备更强的性能和多模态能力，适合作为轻量级AI智能体的核心“大脑”，在性能与资源消耗间取得平衡。
9B版本：结构紧凑，但官方称其性能可媲美体积大13倍的gpt-oss-120B模型。它适合需要较高智能水平但显存资源受限的服务器端部署，是性价比较高的通用模型选择。

目前，所有模型及其基座版本均已在国内的魔搭社区和国际的Hugging Face平台开源。对于热衷于探索前沿项目的开发者来说，这无疑是一次上手实践的绝佳机会。