云栈社区»论坛 › 开发者广场「Dev Plaza」 › Meta发布Muse Spark多模态推理模型，训练成本降低90%重塑AI效率 ...

发回帖发新帖

5768 积分	0 好友	764 主题

发消息

Meta发布Muse Spark多模态推理模型，训练成本降低90%重塑AI效率

发表于 2026-4-10 05:38:27 | 查看: 129| 回复: 0

今天，Meta正式发布了其全新模型——Muse Spark。这款由Meta超智能实验室打造的模型，标志着其在人工智能底层架构上的一次彻底革新，不仅大幅提升了能力，更将训练与推理成本惊人地降低了90%，显著提高了算力利用效率。

Meta官方发布Muse Spark模型的社交媒体截图

重构底层架构，成本直降90%解决行业痛点

这次发布远非一次简单的模型更新。为了推出Muse Spark，Meta的超智能实验室投入了长达9个月的时间，对从模型本身到训练引擎、再到数据处理的全流程进行了彻底的重构，甚至放弃了原有的Llama系列架构。

更关键的是，Muse Spark在设计之初就是原生多模态的。它天然支持工具调用、视觉思维链推理以及多智能体协同，能力远比单纯叠加功能的模型要丰富和高效。

在预训练阶段，Meta改变了以往单纯堆叠算力的思路。研究团队首先在小模型上探索并验证了新的缩放定律，再将这套高效的方法论扩展至大规模模型，从而避免了算力的盲目浪费。通过对数据处理、优化器等全链路环节的优化，每一份计算资源都得到了更有效的利用。结果就是，达到同等能力水平，Muse Spark所需的计算量还不到上一代Llama 4的十分之一，训练成本直接降低了90%。

展示Muse Spark与主流模型计算效率对比的图表

在强化学习环节，Muse Spark也解决了大规模训练不稳定的行业难题。新的技术栈确保了模型能力能够随着训练步数的增加而平稳提升，无论是单次尝试（pass@1）还是多次尝试（pass@16）的通过率都呈现稳定的上升曲线，避免了性能的剧烈波动或倒退。

展示Muse Spark强化学习训练稳定性的图表

这种平稳的训练过程带来的好处是，模型获得的能力并非对训练数据的僵化记忆，而是能够更好地泛化到未见过的全新场景中，在处理新测试数据时也能保持较高的准确率。这种可泛化、可落地的能力，才是真正具有实用价值的。

原生多模态，核心能力全面领先

Muse Spark的综合实力已重回全球第一梯队，其高阶推理能力足以与OpenAI的GPT、Anthropic的Claude等顶尖模型比肩。

它的核心能力覆盖全面：

多模态感知与理解：原生设计的跨模态整合能力，使其在解决几何、物理等视觉难题，以及识别图片实体、目标定位等任务上表现出色。
基础与高阶推理：在逻辑、数学、常识推理方面表现扎实。在极具挑战性的“人类终极考试”基准测试中，其无工具辅助的正确率达到了42.8%，使用工具后更提升至50.4%。在前沿科学研究任务上，准确率也达到了38.3%，处于行业领先水平。
智能体操作：在工具调用、多智能体协同与任务编排上流畅高效，能够自主完成复杂的链式任务。
专业领域深耕：在健康领域，通过与上千名医生合作整理专属数据，其回答健康问题、进行营养分析、提供个性化指导的能力非常专业可靠。

Muse Spark与多款顶尖模型在各类基准测试上的得分对比表格