Meta dévoile Muse Spark, son premier modèle d'IA depuis l'embauche d'Alexandr Wang et un indicateur du projet de plusieurs milliards de dollars du PDG Mark Zuckerberg en matière d'IA.
Meta a dévoilé Muse Spark, le premier modèle d'IA produit par ses Meta Superintelligence Labs, la nouvelle unité de recherche en IA qu'elle a créée l'année dernière et qui a dépensé des milliards de d…
Meta a dévoilé Muse Spark, le premier modèle d'IA produit par ses Meta Superintelligence Labs, la nouvelle unité de recherche en IA qu'elle a créée l'année dernière et qui a dépensé des milliards de dollars en personnel et en équipement.
Le modèle est, selon les tests de référence publiés par Meta, compétitif avec les principaux modèles d'IA d'OpenAI, Anthropic et Google dans de nombreuses tâches, même s'il ne les surpasse pas dans tous les domaines. Pourtant, si les résultats du benchmark résistent lorsqu'ils sont testés par des experts indépendants, Muse Spark semble remettre Meta dans la course à l'IA après que son dernier modèle d'IA, Llama 4, sorti en avril 2025, ait été largement considéré comme un raté. Ce fut le cas avec les benchmarks Llama 4 de Meta, dans lesquels la société a admis plus tard avoir utilisé des versions spécialisées et inédites du modèle, affinées pour des tâches spécifiques, pour améliorer les scores de référence dans ces domaines, alors que la version générale mise à la disposition de tous les utilisateurs n'était pas aussi performante.
Et il y a un autre problème. Peu de personnes pourront utiliser le nouveau modèle Meta en dehors du propre écosystème de produits de l’entreprise. Contrairement aux modèles d'IA précédents de Meta, qui étaient publiés en tant que modèles « à poids ouvert », ce qui signifie que n'importe qui pouvait télécharger les modèles gratuitement et les exécuter sur son propre équipement, ainsi que les modifier et les affiner à sa guise – Muse Spark est, du moins pour le moment, principalement un outil interne pour Meta.
Le modèle alimente actuellement l'assistant Meta AI dans l'application Metaalone AI du stand de l'entreprise et sur meta.ai. La société a annoncé qu'elle le déploierait sur WhatsApp, Instagram, Facebook, Messenger et les lunettes Ray-Ban AI de Meta dans les semaines à venir. Il a également déclaré qu'il proposerait le modèle dans un « aperçu privé » pour sélectionner des partenaires via une interface de programmation d'application (API). Cela rend Muse Spark encore plus propriétaire que les modèles propriétaires payants proposés par les rivaux de Meta. (Meta a déclaré dans un article de blog qu'elle espérait rendre les futures versions open source du modèle.)
Muse Spark est le premier modèle de raisonnement de Meta, ce qui signifie qu'il peut suivre un processus étape par étape, en utilisant différentes stratégies si son approche initiale ne fonctionne pas. Les modèles précédents de l’entreprise étaient tous conçus pour produire une réponse instantanée basée sur la formation du modèle. Muse Spark est également un modèle multimodal qui peut recevoir et afficher à la fois du texte et des images. Le modèle prend également en charge l'utilisation d'autres outils logiciels et peut aider à orchestrer le travail de plusieurs sous-agents, selon un article de blog technique publié par Meta.
Dans son blog annonçant le nouveau modèle, Meta décrit Muse Spark comme « petit et rapide de par sa conception, mais suffisamment capable de raisonner sur des questions complexes en sciences, mathématiques et santé ». Il décrit le modèle comme le premier d'une série de nouveaux modèles, Muse Spark étant utilisé pour valider l'architecture et le régime de formation que Meta utilise, avant que l'entreprise ne l'étende à des modèles plus grands et encore plus puissants de la même famille.
Le modèle dispose également d'un mode « Contemplation » ou « Réflexion » dans lequel il peut faire tourner des sous-agents pour raisonner en parallèle sur différentes parties d'une tâche. Meta a déclaré dans un blog technique publié sur le nouveau modèle que ce mode permet à Muse Spark "de rivaliser avec les modes de raisonnement extrêmes des modèles frontières tels que Gemini Deep Think et GPT Pro".
Les résultats de référence publiés parallèlement au lancement dressent le portrait d'un modèle compétitif mais non dominant. Par exemple, sur le benchmark GPQA Diamond, qui est censé tester les compétences de raisonnement de niveau doctorat, Muse Spark a obtenu un score de 89,5 %, ce qui est légèrement derrière les 94,3 % de Gemini 3.1 Pro ainsi que les 92,7 % et 92,8 % obtenus respectivement par Claude Opus 4.6 d'Anthropic et GPT-5.4 d'OpenAI. Sur un benchmark de référence en matière de santé, HealthBench Hard, Muse Spark a battu tous les modèles concurrents avec un score de 42,8 %, ce qui était bien meilleur que l'Opus 4.6 ou le Gemini 3.1 Pro, et légèrement meilleur que GPT-5.4.
Meta a reconnu les écarts de performances. Son article de blog technique indique que l'entreprise continue « d'investir dans des domaines présentant actuellement des écarts de performance ».