5673 积分	0 好友	724 主题

Qwen3-Max-Thinking重磅发布：超万亿参数与创新推理机制，在数学编程基准中表现卓越

发表于 2026-1-28 01:14:41 | 查看: 167| 回复: 0

Qwen3-Max-Thinking科幻风格宣传图

近日，阿里巴巴正式发布了其规模最大、能力最强的千问推理模型——Qwen3-Max-Thinking。这款模型不仅在参数和数据量上刷新了记录，更通过独特的推理机制与增强的智能体能力，实现了整体性能的飞跃。

模型规模和能力

Qwen3-Max-Thinking的总参数量突破了1万亿（1T），其预训练数据量更是达到了惊人的36T Tokens。这一庞大规模使其稳坐千问系列模型的头把交椅，性能相比前代版本有了质的提升。

在多项权威基准测试中，Qwen3-Max-Thinking均刷新了全球记录，尤其在数学推理、复杂推理和指令遵循等领域展现出了卓越的能力。

Qwen3-Max-Thinking的核心亮点之一，在于其采用的测试时扩展（Test-time Scaling）机制。这一创新设计不仅提升了模型的性能，还优化了计算效率。

与业界常见的单纯增加并行推理路径方法不同，Qwen3-Max-Thinking采用了“经验提取式”的推理方式。模型能够在给定的上下文中进行多轮自我迭代，从而提升推理计算效率，避免冗余计算，最终得到更智能、更准确的推理结果。

这一机制的效果在实战测试中得到了充分验证。在启用工具的情况下，Qwen3-Max-Thinking在“人类最后的测试（HLE）”中取得了58.3的高分，远超GPT-5.2-Thinking的45.5和Gemini 3 Pro的45.8，堪称当前所有推理模型中的佼佼者。

为了迎接智能体（Agent）时代的到来，Qwen3-Max-Thinking大幅强化了其原生的Agent工具调用能力。模型现在能够自主地根据上下文选择最合适的工具来处理任务，例如调用搜索、个性化记忆和代码解释器等功能。

这项能力的加入，使得模型在与用户对话时能够更精准地理解需求，并调用外部工具来提供更专业、更准确的回答，这不仅减少了模型的“幻觉”现象，也显著提升了其实用性和智能化水平。这一进步也是当前人工智能领域向实用化迈进的重要一步。

Qwen3-Max-Thinking强大的性能背后，离不开其采用的强化学习后训练策略。通过在多项任务上进行基于规则奖励与模型奖励的联合强化学习，该模型学会了灵活组合多种工具来完成任务，展现出了强大的推理逻辑与多任务协同处理能力。

目前，开发者和企业用户可以通过 QwenChat 平台免费体验Qwen3-Max-Thinking模型。普通用户也可以通过千问PC端和网页端进行试用。对于有商业化需求的企业，可以通过阿里云百炼平台获取稳定可靠的模型API服务。

这款模型的发布，为全球的开源社区与AI开发者提供了一个全新的、强大的工具选择。想了解更多关于前沿AI模型的技术解析与实战讨论，欢迎持续关注云栈社区，与众多技术同仁一起探索智能的未来。