
2026年除夕夜,当大多数人正忙碌于年夜饭时,阿里巴巴悄然完成了一项重大发布。
没有漫长的预热,没有复杂的发布会,Qwen3.5-Plus 直接空降魔搭社区(ModelScope)和 HuggingFace。官方定调非常明确:这是目前全球最强的开源模型。在千问APP中切换到 qwen-plus 模型,用户已经可以体验到这一最新技术。

如果说过去的模型竞赛是“堆料大赛”,比拼谁的参数多、谁的显卡贵;那么 Qwen3.5 的发布,标志着 大模型 行业正式进入了“效率为王”的下半场。
它用不到前代四分之一的激活参数,跑出了超越万亿参数模型的性能。“小而强”成了 Qwen3.5 最鲜明的标签。
核心突破:重新定义“不可能三角”

在传统认知中,大模型领域一直存在一个“不可能三角”:能力强、速度快、成本低,通常只能三选二。但 Qwen3.5 似乎打破了这个魔咒。
1. 架构革命:只调用“对的人”干活
Qwen3.5 采用了全新的高稀疏 MoE(混合专家)架构。
- 总参数:3970 亿(知识储备库极大)
- 激活参数:仅 170 亿(每次推理只调用极少部分)
通俗理解:以前的模型回答问题,像是一个公司 3970 亿人全部开会讨论,既慢又贵;Qwen3.5 则像是一个拥有 3970 亿专家的智库,你问数学题,它只呼叫“数学组”的 170 个专家,其他人继续休息。
结果显而易见:显存占用降低 60%,推理吞吐量提升 19 倍,速度飞快,成本骤降。

2. 原生多模态:不仅是“看”,更是“懂”
以前的多模态模型,往往是“视觉编码器 + 语言模型”的拼接,像是在两个大脑之间传话,容易失真。
Qwen3.5 实现了真正的“原生融合”。从预训练第一天起,它就在图文混合数据中学习。
- 视频理解:支持长达 2 小时的视频直接输入,能精准分析剧情、提取关键帧。
- GUI 操作:给它一张手绘的 APP 草图,它能瞬间生成可运行的前端代码;给它一张报错截图,它能直接定位 UI 问题并修复。
- 艺术鉴赏:面对达利的《记忆的永恒》,它不仅能认出“融化的时钟”,还能深度解读其超现实主义背景和象征意义。
3. 超级智能体(Agent):从“对话者”变身“执行者”
Qwen3.5 不再满足于陪你聊天,它要帮你干活。
基于全新的异步强化学习框架,Qwen3.5 具备了跨设备操作能力:
- 手机端:“帮我点一杯常喝的拿铁送到公司。” -> 自动打开 APP、选择商品、下单。
- PC 端:“把微信里的表格下载,整理数据填到 Excel,再发邮件给老板。” -> 自动跨应用流转,完成复杂工作流。
在权威评测 BFCL-V4 和 Browsecomp 中,Qwen3.5 的 Agent 能力甚至超越了 Gemini 3 Pro 和 GPT-5.2。
价格屠夫:让顶级 AI 飞入寻常百姓家

技术再强,用不起也是白搭。Qwen3.5 最让人震撼的,是它的定价策略。
- Qwen3.5-Plus API 价格:0.8 元 / 百万 Token
- 对比竞品:仅为同类闭源顶尖模型(如 Gemini 3 Pro)价格的 1/18,是 GPT-5.2 的 1/15。
这意味着什么?个人开发者、大学生创业团队,现在可以用极低的成本,调用到媲美全球最强闭源模型的算力。AI 的技术红利,终于真正向下渗透。
硬核成绩单:数据不会说谎
在多项全球权威基准测试中,Qwen3.5 交出了一份“满分答卷”:
| 评测维度 |
Qwen3.5 得分 |
对比表现 |
| 综合认知 MMLU-Pro |
87.8 |
超越 GPT-5.2 |
| 专业难题 GPQA (博士级) |
88.4 |
高于 Claude 4.5 |
| 指令遵循 IFBench |
76.5 |
刷新全球纪录 |
| 智能体能力 BFCL-V4 |
SOTA |
超越 Gemini 3 Pro |
| 多模态理解 MathVision |
Best |
同级最优 |
更有趣的是,在面对“洗车离家 100 米,开车还是走路”这种逻辑陷阱题时,Qwen3.5 展现了类似人类的思维链(CoT):识别陷阱 -> 幽默作答 -> 贴心提醒。它不再是冷冰冰的机器,更像是一个有温度的伙伴。
生态意义:开源的力量
Qwen3.5 的发布,不仅仅是阿里的胜利,更是开源社区的胜利。
- 语言覆盖:支持语言从 119 种扩展至 201 种,打破语言壁垒。
- 开发者友好:已在 HuggingFace 和魔搭社区开源,提供 2B 密集版和 35B/397B MoE 版多种选择。
- 应用落地:千问 APP、PC 端已全面接入,开发者可立即基于新模型构建应用。
正如社区所言:“最强”和“最便宜”第一次出现在了同一个模型上。这将激发无数创新应用的诞生,从教育助手到医疗顾问,从个人助理到企业自动化,AI 的想象力边界被再次拓宽。
大模型的下半场

Qwen3.5 的发布传递了一个清晰信号:大模型的竞争,已经从单纯的“规模扩张”转向了“架构创新”与“实用落地”。
不再盲目追求万亿参数,而是通过混合注意力、稀疏 MoE、原生多模态等技术,实现“以小胜大”。这不仅降低了全社会的算力成本,更让 AI 真正成为了人人可用的生产力工具。
2026 年的春天,属于 Qwen3.5,也属于每一个敢于利用 AI 创造价值的个体。访问 chat.qwen.ai 或前往魔搭社区下载开源权重,开启你的 Qwen3.5 之旅。