Meta发布Muse Spark,MSL的首份答卷!Alexandr Wang通过了吗?

作者:互联网

2026-04-15

AI快讯

Meta 刚刚发布了 Muse Spark,这是 Meta Superintelligence Labs (MSL) 的首个模型,也是九个月技术栈重构的成果。在大家都在卷参数量的当下,Meta 选择了另一条路:效率优先。

九个月的技术栈重构

Alexandr Wang 在推文中详细说明了这次彻底的重构:"九个月前我们重建了 AI 技术栈,新的基础设施、新的架构、新的数据管道。Muse Spark 就是这项工作的成果,现在它已经驱动 Meta AI。"

这种重构带来了惊人的效率提升。Muse Spark 实现了与 Llama 4 Maverick 同等的性能,但计算需求减少了十倍以上。

原生多模态推理能力

Muse Spark 是一个原生多模态推理模型,支持工具使用、视觉思维链和多智能体编排。这是 Meta 发布过的最强大的模型,在整个训练过程中,他们看到了在预训练、强化学习和测试时推理方面的可预测扩展。

Contemplating 模式:并行推理突破

Meta 还发布了 Contemplating 模式,该模式编排多个并行推理的智能体,专门处理复杂的科学和推理查询。在测试中,发现它与 Gemini Deep Think 和 GPT Pro 等其他极端推理模型具有竞争力。

在挑战性任务中,Contemplating 模式提供了显著的能力提升:

人类最后的考试(多学科推理无工具):50%人类最后的考试(多学科推理有工具):58%IPhO 2025(理论):38%FrontierScience Research:38%

安全评估表现突出

在部署前,Meta 进行了广泛的安全评估。Muse Spark 在高风险领域如生物和化学武器方面表现出强烈的拒绝行为,拒绝率达到 98.0%,远高于其他模型:

Muse Spark:98.0%Opus 4.6:95.4%GPT 5.4:74.7%Gemini 3.1 Pro:61.5%Kimi K2.5:21.2%

产品功能全面升级

Meta AI 现在通过即时模式和思考模式处理快速回答和深度推理。新增的购物模式能够识别创作者、品牌和风格内容,并将其转化为推荐。

Muse Spark 驱动的 Meta AI 能够看到和理解周围的世界,从应用中的真实对话中提取信息,并在健康、科学和数学领域进行复杂问题的推理。该模型为每天使用 Meta 应用的 30 亿用户构建。

基准测试表现

在 Artificial Analysis Intelligence Index 上,Muse Spark 获得 52 分,位列第四。

但真正值得关注的是效率数据:跑完整个 Intelligence Index,Muse Spark 只用了 5800 万输出 token,与 Gemini 3.1 Pro 持平,但只有 Claude Opus 4.6 的三分之一多点。

能力分布均衡

视觉能力:MMMU-Pro 上得分 80.5%,仅次于 Gemini 3.1 Pro推理能力:HLE 上获得 39.9%,紧跟头部模型Agent 能力:GDPval-AA 上 1427 分,相对较弱

商业化转向明显

这是 Meta 第一个不放开源权重的前沿模型。虽然目前仅向特定合作伙伴开放私有 API 预览,但官方表示计划开源未来版本。

Alexandr Wang 强调:"这是第一步。更大的模型已经在开发中,基础设施也在相应扩展。我们对 MSL 团队感到无比自豪,对未来的发展充满期待!"

产品整合进展

Muse Spark 目前正在 Meta AI、Face@book、In@stagram 和 WhatsApp 中逐步推出。用户可以通过 meta.ai 或 Meta AI 应用体验新模型。

开发团队态度

Alexandr Wang 坦诚表示:"这是 MSL 的第一个模型,肯定还有一些粗糙的地方需要打磨。但无论如何——我们很兴奋让大家都来试试!"

小结

扎克伯格重组 Meta Superintelligence Labs 的决定看起来是认真的。一年没有大动作,一出手就是准一线水平。虽然没得到第一,但这算是良好的起点。这对于备受嘲讽的Meta,以及Alexandr Wang都算是一个还不错的交代。

本文转载自​​AI工程化​​,作者:winkrun

相关标签:

Muse Spark Contemplating Instagram

相关推荐