阿里巴巴Qwen团队刚刚放出了一个重磅消息:Qwen3.6-27B 正式 开源。这款模型在 智能体编程 领域全面超越了自家前代旗舰 Qwen3.5-397B,但参数量却只有前者的约 1/15。这意味着开发者现在可以用更低的硬件成本跑出更强的代码能力。

性能表现
官方公布的成绩单显示,Qwen3.6-27B 的提升是全方位的,尤其是在 智能体编程(Agentic Coding) 领域。
在四大智能体编程基准测试中,Qwen3.6-27B 全面超过前代。差距最明显的是 SkillsBench,得分从老旗舰的 30.0 直接飙升至 48.2,提升幅度超过 60%。

推理与数学:直逼顶尖闭源模型
除了代码能力,基础推理和数学也没落下:
- GPQA Diamond(研究生级科学推理):87.8 分,已经摸到了 Claude 4.5 Opus 的水平。
- AIME26(数学竞赛):94.1 分,小幅超越前代旗舰。
- MMLU-Pro / C-Eval:在通用知识和中文理解榜单上稳居第一梯队。

核心创新
Qwen3.6-27B 远不只是一个“大号代码补全器”,它在底层技术上针对真实开发场景做了深度定制。
强化真实开发适配
训练重点加强了代码库理解、跨文件编辑、前端生成与终端命令执行等能力,能生成可直接运行的工业级代码,而非玩具级 Demo。
Thinking Preservation(思维保留机制)
这是一大创新点。在多轮编程调试中,该机制能保留历史思考链,解决 AI“改代码就失忆”的顽疾,保证长周期任务中的逻辑连贯性。
Gated DeltaNet 混合注意力架构
在降低显存占用的同时,保障了代码理解与生成的质量;配合多 Token 预测技术,显著优化了推理效率。
功能与应用场景
除了强悍的编程能力,Qwen3.6-27B 还是个“六边形战士”。
原生多模态
延续 Qwen3.6 系列的优势,原生支持文本、图像、视频理解,无需额外挂载视觉模块。单一模型就能搞定图文对话、图表分析和视频内容理解。

思考 / 非思考双模式
用户可以根据任务自由切换。在“思考模式”下,模型适合处理复杂逻辑推理(比如创作绘本);常规模式下,则侧重快速响应。
适用场景
- 智能体开发:构建能自主完成复杂编码任务的 AI Agent。
- 企业级代码辅助:跨文件重构、自动化脚本编写、前端页面生成。
- 多模态数据分析:结合图表、文档截图进行内容解读与代码生成。
项目官网:https://qwen.ai/blog?id=qwen3.6-27b
开源地址:https://huggingface.co/Qwen/Qwen3.6-27
如果想深入参与开源大模型的技术讨论,欢迎访问 云栈社区。
|