Meta 推出 Muse Spark,这是自聘请 Alexandr Wang 以来的第一个人工智能模型,也是首席执行官马克·扎克伯格 (Mark Zuckerberg) 数十亿美元人工智能推动计划的领头羊
Meta 推出了 Muse Spark,这是其去年创建的新人工智能研究单位 Meta Superintelligence Labs 生产的第一个人工智能模型,并花费了数十亿美元用于人员和设备。 根据 Meta 发布的基准测试,该模型可与 OpenAI、Anthropic 和 Google 跨越了许多任务,尽管它并没有全面超越它们。尽管如此,如果基准测试结果在独立专家的测试中成立,那么在 2025 …
Meta 推出了 Muse Spark,这是其去年创建的新人工智能研究单位 Meta Superintelligence Labs 生产的第一个人工智能模型,并花费了数十亿美元用于人员和设备。
根据 Meta 发布的基准测试,该模型可与 OpenAI、Anthropic 和 Google 跨越了许多任务,尽管它并没有全面超越它们。尽管如此,如果基准测试结果在独立专家的测试中成立,那么在 2025 年 4 月发布的最后一个人工智能模型 Llama 4 被广泛批评为失败后,Muse Spark 似乎让 Meta 重新回到了人工智能竞赛中。
然而,在过去,Meta 曾被发现操纵已发布的人工智能模型基准测试结果,使其看起来比大多数用户实际可用的版本更强大。 Meta 的 Llama 4 基准测试就是这种情况,该公司后来承认使用专门的、未发布的模型版本,针对特定任务进行了微调,以提高这些领域的基准分数,而向所有用户提供的通用版本的表现则不佳。
还有另一个问题。很少有人能够在公司自己的产品生态系统之外使用新的元模型。 Meta 之前的 AI 模型以“开放权重”模型的形式发布(这意味着任何人都可以免费下载模型并在自己的设备上运行它们,也可以根据自己的意愿修改和微调它们),而 Muse Spark 与 Meta 之前的 AI 模型不同,至少目前它主要是 Meta 的内部工具。
该模型目前为公司独立 Meta AI 应用程序和 meta.ai。该公司表示,将在未来几周内将其推广到 WhatsApp、Instagram、Facebook、Messenger 和 Meta 的 Ray-Ban AI 眼镜。它还表示将通过应用程序编程接口(API)以“私人预览”的形式向选择的合作伙伴提供该模型。这使得 Muse Spark 比 Meta 竞争对手提供的付费专有模型更具专有性。 (Meta 在一篇博文中表示,希望开源该模型的未来版本。)
Muse Spark 是 Meta 的第一个推理模型,这意味着它可以逐步完成一个过程,如果最初的方法不起作用,则可以使用不同的策略。该公司之前的模型都是为了根据模型的训练产生即时答案。 Muse Spark 也是一个多模式模型,可以接收和输出文本和图像。根据 Meta 发布的技术博客文章,该模型还支持使用其他软件工具,并可以帮助协调多个子代理的工作。
在宣布新模型的博客文章中,Meta 将 Muse Spark 描述为“设计小巧、速度快,但有足够的能力推理科学、数学和健康方面的复杂问题。”它将该模型描述为一系列新模型中的第一个,在该公司将其扩展到同系列中更大、更强大的模型之前,Muse Spark 用于验证 Meta 正在使用的架构和训练机制。
该模型还具有“思考”或“思考”模式,在该模式中,它可以启动子代理来并行推理任务的不同部分。 Meta 在其发布的关于新模型的技术博客中表示,该模式可以让 Muse Spark“与 Gemini Deep Think 和 GPT Pro 等前沿模型的极限推理模式竞争。”
发布时发布的基准测试结果描绘了一幅具有竞争力但不占主导地位的模型的图景。例如,在测试博士级推理能力的 GPQA Diamond 基准测试中,Muse Spark 得分为 89.5%,略低于 Gemini 3.1 Pro 的 94.3%,以及 Anthropic 的 Claude Opus 4.6 和 OpenAI 的 GPT-5.4 的 92.7% 和 92.8%。在领先的健康基准 HealthBench Hard 上,Muse Spark 以 42.8% 的成绩击败了所有竞争对手,远远优于 Opus 4.6 或 Gemini 3.1 Pro,略优于 GPT-5.4。
Meta 承认存在性能差距。其技术博客文章指出,该公司继续投资于当前性能差距的领域,