云栈社区»论坛 › 开发者广场「Dev Plaza」 › 阿里巴巴Qwen3.5发布：开源最强模型以MoE架构颠覆大模型效率 ...

发回帖发新帖

5688 积分	0 好友	750 主题

发消息

阿里巴巴Qwen3.5发布：开源最强模型以MoE架构颠覆大模型效率

发表于 2026-2-18 21:41:46 | 查看: 279| 回复: 0

Qwen3.5除夕夜发布主题插图

2026年除夕夜，当大多数人正忙碌于年夜饭时，阿里巴巴悄然完成了一项重大发布。

没有漫长的预热，没有复杂的发布会，Qwen3.5-Plus 直接空降魔搭社区（ModelScope）和 HuggingFace。官方定调非常明确：这是目前全球最强的开源模型。在千问APP中切换到 qwen-plus 模型，用户已经可以体验到这一最新技术。

千问APP中Qwen3.5-Plus模型介绍截图

如果说过去的模型竞赛是“堆料大赛”，比拼谁的参数多、谁的显卡贵；那么 Qwen3.5 的发布，标志着大模型行业正式进入了“效率为王”的下半场。

它用不到前代四分之一的激活参数，跑出了超越万亿参数模型的性能。“小而强”成了 Qwen3.5 最鲜明的标签。

核心突破：重新定义“不可能三角”

Qwen3.5效率对比示意图

在传统认知中，大模型领域一直存在一个“不可能三角”：能力强、速度快、成本低，通常只能三选二。但 Qwen3.5 似乎打破了这个魔咒。

1. 架构革命：只调用“对的人”干活

Qwen3.5 采用了全新的高稀疏 MoE（混合专家）架构。

总参数：3970 亿（知识储备库极大）
激活参数：仅 170 亿（每次推理只调用极少部分）

通俗理解：以前的模型回答问题，像是一个公司 3970 亿人全部开会讨论，既慢又贵；Qwen3.5 则像是一个拥有 3970 亿专家的智库，你问数学题，它只呼叫“数学组”的 170 个专家，其他人继续休息。

结果显而易见：显存占用降低 60%，推理吞吐量提升 19 倍，速度飞快，成本骤降。

Qwen3.5多模态与代码能力插图

2. 原生多模态：不仅是“看”，更是“懂”

以前的多模态模型，往往是“视觉编码器 + 语言模型”的拼接，像是在两个大脑之间传话，容易失真。

Qwen3.5 实现了真正的“原生融合”。从预训练第一天起，它就在图文混合数据中学习。

视频理解：支持长达 2 小时的视频直接输入，能精准分析剧情、提取关键帧。
GUI 操作：给它一张手绘的 APP 草图，它能瞬间生成可运行的前端代码；给它一张报错截图，它能直接定位 UI 问题并修复。
艺术鉴赏：面对达利的《记忆的永恒》，它不仅能认出“融化的时钟”，还能深度解读其超现实主义背景和象征意义。

3. 超级智能体（Agent）：从“对话者”变身“执行者”

Qwen3.5 不再满足于陪你聊天，它要帮你干活。

基于全新的异步强化学习框架，Qwen3.5 具备了跨设备操作能力：

手机端：“帮我点一杯常喝的拿铁送到公司。” -> 自动打开 APP、选择商品、下单。
PC 端：“把微信里的表格下载，整理数据填到 Excel，再发邮件给老板。” -> 自动跨应用流转，完成复杂工作流。

在权威评测 BFCL-V4 和 Browsecomp 中，Qwen3.5 的 Agent 能力甚至超越了 Gemini 3 Pro 和 GPT-5.2。

价格屠夫：让顶级 AI 飞入寻常百姓家

Qwen3.5价格与性能对比图表

技术再强，用不起也是白搭。Qwen3.5 最让人震撼的，是它的定价策略。

Qwen3.5-Plus API 价格：0.8 元 / 百万 Token
对比竞品：仅为同类闭源顶尖模型（如 Gemini 3 Pro）价格的 1/18，是 GPT-5.2 的 1/15。

这意味着什么？个人开发者、大学生创业团队，现在可以用极低的成本，调用到媲美全球最强闭源模型的算力。AI 的技术红利，终于真正向下渗透。

硬核成绩单：数据不会说谎

在多项全球权威基准测试中，Qwen3.5 交出了一份“满分答卷”：

评测维度	Qwen3.5 得分	对比表现
综合认知 MMLU-Pro	87.8	超越 GPT-5.2
专业难题 GPQA (博士级)	88.4	高于 Claude 4.5
指令遵循 IFBench	76.5	刷新全球纪录
智能体能力 BFCL-V4	SOTA	超越 Gemini 3 Pro
多模态理解 MathVision	Best	同级最优

更有趣的是，在面对“洗车离家 100 米，开车还是走路”这种逻辑陷阱题时，Qwen3.5 展现了类似人类的思维链（CoT）：识别陷阱 -> 幽默作答 -> 贴心提醒。它不再是冷冰冰的机器，更像是一个有温度的伙伴。

生态意义：开源的力量

Qwen3.5 的发布，不仅仅是阿里的胜利，更是开源社区的胜利。

语言覆盖：支持语言从 119 种扩展至 201 种，打破语言壁垒。
开发者友好：已在 HuggingFace 和魔搭社区开源，提供 2B 密集版和 35B/397B MoE 版多种选择。
应用落地：千问 APP、PC 端已全面接入，开发者可立即基于新模型构建应用。

正如社区所言：“最强”和“最便宜”第一次出现在了同一个模型上。这将激发无数创新应用的诞生，从教育助手到医疗顾问，从个人助理到企业自动化，AI 的想象力边界被再次拓宽。

大模型的下半场

大模型生态与未来展望插图

Qwen3.5 的发布传递了一个清晰信号：大模型的竞争，已经从单纯的“规模扩张”转向了“架构创新”与“实用落地”。

不再盲目追求万亿参数，而是通过混合注意力、稀疏 MoE、原生多模态等技术，实现“以小胜大”。这不仅降低了全社会的算力成本，更让 AI 真正成为了人人可用的生产力工具。

2026 年的春天，属于 Qwen3.5，也属于每一个敢于利用 AI 创造价值的个体。访问 chat.qwen.ai 或前往魔搭社区下载开源权重，开启你的 Qwen3.5 之旅。

上一篇：.NET微服务实战：使用CAP库处理分布式事务与事件通信
下一篇：苹果春季发布会定档3月4日，iPhone 17e/M5芯片MacBook等新品前瞻

Qwen3．5, 大模型, MoE, 开源, 人工智能