找回密码
立即注册
搜索
热搜: Java Python Linux Go
发回帖 发新帖

5096

积分

0

好友

683

主题
发表于 昨天 20:36 | 查看: 4| 回复: 0

阿里巴巴Qwen团队刚刚放出了一个重磅消息:Qwen3.6-27B 正式 开源。这款模型在 智能体编程 领域全面超越了自家前代旗舰 Qwen3.5-397B,但参数量却只有前者的约 1/15。这意味着开发者现在可以用更低的硬件成本跑出更强的代码能力。

Qwen3.6-27B 开源发布与技术特性宣传图

性能表现

官方公布的成绩单显示,Qwen3.6-27B 的提升是全方位的,尤其是在 智能体编程(Agentic Coding) 领域。

在四大智能体编程基准测试中,Qwen3.6-27B 全面超过前代。差距最明显的是 SkillsBench,得分从老旗舰的 30.0 直接飙升至 48.2,提升幅度超过 60%

Qwen3.6-27B 与其他模型在 Terminal-Bench、SWE-bench、QwenClawBench 等多个 Agentic Coding 基准上的性能对比

推理与数学:直逼顶尖闭源模型

除了代码能力,基础推理和数学也没落下:

  • GPQA Diamond(研究生级科学推理):87.8 分,已经摸到了 Claude 4.5 Opus 的水平。
  • AIME26(数学竞赛):94.1 分,小幅超越前代旗舰。
  • MMLU-Pro / C-Eval:在通用知识和中文理解榜单上稳居第一梯队。

Qwen3.6-27B 与多模型在 GPQA Diamond、AIME26 等 STEM 与推理任务上的得分对比表

核心创新

Qwen3.6-27B 远不只是一个“大号代码补全器”,它在底层技术上针对真实开发场景做了深度定制。

强化真实开发适配
训练重点加强了代码库理解、跨文件编辑、前端生成与终端命令执行等能力,能生成可直接运行的工业级代码,而非玩具级 Demo。

Thinking Preservation(思维保留机制)
这是一大创新点。在多轮编程调试中,该机制能保留历史思考链,解决 AI“改代码就失忆”的顽疾,保证长周期任务中的逻辑连贯性。

Gated DeltaNet 混合注意力架构
在降低显存占用的同时,保障了代码理解与生成的质量;配合多 Token 预测技术,显著优化了推理效率。

功能与应用场景

除了强悍的编程能力,Qwen3.6-27B 还是个“六边形战士”。

原生多模态
延续 Qwen3.6 系列的优势,原生支持文本、图像、视频理解,无需额外挂载视觉模块。单一模型就能搞定图文对话、图表分析和视频内容理解。

Qwen3.6 原生多模态能力示意:文本理解、图像理解、表格分析、视频理解

思考 / 非思考双模式
用户可以根据任务自由切换。在“思考模式”下,模型适合处理复杂逻辑推理(比如创作绘本);常规模式下,则侧重快速响应。

适用场景  

  • 智能体开发:构建能自主完成复杂编码任务的 AI Agent。  
  • 企业级代码辅助:跨文件重构、自动化脚本编写、前端页面生成。  
  • 多模态数据分析:结合图表、文档截图进行内容解读与代码生成。
项目官网:https://qwen.ai/blog?id=qwen3.6-27b
开源地址:https://huggingface.co/Qwen/Qwen3.6-27

如果想深入参与开源大模型的技术讨论,欢迎访问 云栈社区




上一篇:阿里二面:RAG检索优化有哪些系统性策略?四层框架剖析
下一篇:抖音灰色引流链路拆解:从短视频到企业微信的私域变现漏斗与真实转化数据
您需要登录后才可以回帖 登录 | 立即注册

手机版|小黑屋|网站地图|云栈社区 ( 苏ICP备2022046150号-2 )

GMT+8, 2026-4-25 02:12 , Processed in 0.846565 second(s), 41 queries , Gzip On.

Powered by Discuz! X3.5

© 2025-2026 云栈社区.

快速回复 返回顶部 返回列表