Meta stellt Muse Spark vor, sein erstes KI-Modell seit der Einstellung von Alexandr Wang und ein Vorreiter für den milliardenschweren KI-Vorstoß von CEO Mark Zuckerberg
Meta hat Muse Spark vorgestellt, das erste KI-Modell, das von seinen Meta Superintelligence Labs, der neuen KI-Forschungseinheit, die es letztes Jahr gegründet hat, hergestellt wurde und Milliarden vo…
Meta hat Muse Spark vorgestellt, das erste KI-Modell, das von seinen Meta Superintelligence Labs, der neuen KI-Forschungseinheit, die es letztes Jahr gegründet hat, hergestellt wurde und Milliarden von Dollar für Personal und Ausrüstung ausgegeben hat.
Das Modell ist laut von Meta veröffentlichten Benchmark-Tests konkurrenzfähig mit führenden KI-Modellen von OpenAI, Anthropic und Google übertrifft sie bei vielen Aufgaben, übertrifft sie jedoch nicht in allen Bereichen. Wenn die Benchmark-Ergebnisse bei Tests durch unabhängige Experten jedoch bestehen bleiben, scheint Muse Spark Meta wieder in den KI-Wettbewerb zu bringen, nachdem sein letztes KI-Modell, Llama 4, das im April 2025 veröffentlicht wurde, weithin als Blindgänger abgetan wurde.
In der Vergangenheit wurde Meta jedoch dabei erwischt, wie er die veröffentlichten Benchmark-Ergebnisse eines KI-Modells manipulierte, um es leistungsfähiger erscheinen zu lassen, als die für die meisten Benutzer verfügbare Version tatsächlich war. Dies war bei den Llama 4-Benchmarks von Meta der Fall, bei denen das Unternehmen später zugab, spezielle, unveröffentlichte Versionen des Modells zu verwenden, die auf bestimmte Aufgaben abgestimmt waren, um die Benchmark-Ergebnisse in diesen Bereichen zu verbessern, während die allgemeine Version, die allen Benutzern zur Verfügung gestellt wurde, nicht so gut abschnitt.
Und es gibt noch einen weiteren Haken. Nur wenige Menschen werden das neue Meta-Modell außerhalb des unternehmenseigenen Produkt-Ökosystems nutzen können. Im Gegensatz zu Metas früheren KI-Modellen, die als „Open Weight“-Modelle veröffentlicht wurden – das heißt, jeder konnte die Modelle kostenlos herunterladen und auf seiner eigenen Ausrüstung ausführen sowie sie nach Belieben modifizieren und verfeinern –, ist Muse Spark zumindest im Moment in erster Linie ein internes Tool für Meta.
Das Modell unterstützt derzeit den Meta-KI-Assistenten in der eigenständigen Meta-KI-App des Unternehmens und auf meta.ai. Das Unternehmen gab bekannt, dass es es in den kommenden Wochen auf WhatsApp, Instagram, Facebook, Messenger und Metas Ray-Ban-KI-Brille einführen wird. Es hieß außerdem, dass es das Modell in einer „privaten Vorschau“ ausgewählten Partnern über eine Anwendungsprogrammierschnittstelle (API) anbieten wird. Damit ist Muse Spark noch proprietärer als die kostenpflichtigen proprietären Modelle der Meta-Konkurrenten. (Meta sagte in einem Blog-Beitrag, dass es hofft, zukünftige Versionen des Modells als Open-Source-Lösung anbieten zu können.)
Muse Spark ist Metas erstes Argumentationsmodell, das heißt, es kann einen Prozess Schritt für Schritt abarbeiten und dabei verschiedene Strategien anwenden, wenn der ursprüngliche Ansatz nicht funktioniert. Die Vorgängermodelle des Unternehmens waren alle darauf ausgelegt, basierend auf dem Training des Modells eine sofortige Antwort zu liefern. Muse Spark ist außerdem ein multimodales Modell, das sowohl Text als auch Bilder aufnehmen und ausgeben kann. Laut einem von Meta veröffentlichten technischen Blogbeitrag unterstützt das Modell auch die Verwendung anderer Softwaretools und kann dabei helfen, die Arbeit mehrerer Subagenten zu orchestrieren.
In seinem Blogbeitrag, in dem das neue Modell angekündigt wird, beschreibt Meta Muse Spark als „vom Design her klein und schnell, aber dennoch fähig genug, um komplexe Fragen in Naturwissenschaften, Mathematik usw. zu lösen.“ Gesundheit.“ Es beschreibt das Modell als das erste einer Reihe neuer Modelle, wobei Muse Spark zur Validierung der von Meta verwendeten Architektur und des Trainingsregimes verwendet wird, bevor das Unternehmen dies auf größere und noch leistungsfähigere Modelle derselben Familie skaliert.
Das Modell verfügt außerdem über einen „Kontemplating“- oder „Thinking“-Modus, in dem es Subagenten starten kann, um parallel über verschiedene Teile einer Aufgabe nachzudenken. Meta sagte in einem technischen Blog, den es über das neue Modell veröffentlichte, dass dieser Modus es Muse Spark ermöglicht, „mit den extremen Argumentationsmodi von Grenzmodellen wie Gemini Deep Think und GPT Pro zu konkurrieren.“
Die parallel zur Markteinführung veröffentlichten Benchmark-Ergebnisse zeichnen das Bild eines Modells, das konkurrenzfähig, aber nicht dominant ist. Beim GPQA Diamond Benchmark, der die Denkfähigkeit auf PhD-Niveau testen soll, erreichte Muse Spark beispielsweise 89,5 %, was leicht hinter den 94,3 % von Gemini 3.1 Pro sowie den 92,7 % und 92,8 % von Claude Opus 4.6 von Anthropic und GPT-5.4 von OpenAI zurückblieb. Bei einem führenden Gesundheits-Benchmark, HealthBench Hard, schlug Muse Spark alle Konkurrenzmodelle mit einer Punktzahl von 42,8 %, was weitaus besser war als Opus 4.6 oder Gemini 3.1 Pro und etwas besser als GPT-5.4.
Meta hat die Leistungslücken anerkannt. In seinem technischen Blogbeitrag heißt es, dass das Unternehmen weiterhin „in Bereiche mit aktuellen Leistungslücken investiert“, s