ميتا تكشف النقاب عن Muse Spark، أول نموذج لها في مجال الذكاء الاصطناعي منذ تعيين ألكسندر وانغ ورائد في مشروع الذكاء الاصطناعي للرئيس التنفيذي مارك زوكربيرج الذي تبلغ قيمته عدة مليارات من الدولارات
كشفت Meta النقاب عن Muse Spark، أول نموذج للذكاء الاصطناعي أنتجته Meta Superintelligence Labs، وهي وحدة أبحاث الذكاء الاصطناعي الجديدة التي أنشأتها العام الماضي وأنفقت مليارات الدولارات على الموظفين و…
كشفت Meta النقاب عن Muse Spark، أول نموذج للذكاء الاصطناعي أنتجته Meta Superintelligence Labs، وهي وحدة أبحاث الذكاء الاصطناعي الجديدة التي أنشأتها العام الماضي وأنفقت مليارات الدولارات على الموظفين والتجهيز.
يتنافس هذا النموذج، وفقًا للاختبارات المعيارية التي نشرتها Meta، مع نماذج الذكاء الاصطناعي الرائدة من OpenAI وAnthropic وGoogle في العديد من المهام، على الرغم من أنه لا يتفوق عليها في جميع المجالات. ومع ذلك، إذا صمدت النتائج المعيارية عند اختبارها من قبل خبراء مستقلين، فيبدو أن Muse Spark يعيد Meta إلى سباق الذكاء الاصطناعي بعد أن تم انتقاد نموذج الذكاء الاصطناعي الأخير، Llama 4، الذي تم إصداره في أبريل 2025، على نطاق واسع باعتباره فاشلاً.
في الماضي، تم القبض على Meta وهي تتلاعب بالنتائج المعيارية المنشورة لنموذج الذكاء الاصطناعي لجعله يبدو أكثر قدرة من الإصدار المتاح لمعظم المستخدمين في الواقع. كان هذا هو الحال مع معايير Meta's Llama 4، حيث اعترفت الشركة لاحقًا باستخدام إصدارات متخصصة لم يتم إصدارها من النموذج، وتم ضبطها بدقة لمهام محددة، لتعزيز النتائج المعيارية في تلك المجالات، في حين أن الإصدار العام الذي تم توفيره لجميع المستخدمين لم يكن أداؤه جيدًا.
وهناك مشكلة أخرى. لن يتمكن سوى عدد قليل من الأشخاص من استخدام نموذج Meta الجديد خارج النظام البيئي للمنتجات الخاصة بالشركة. على عكس نماذج الذكاء الاصطناعي السابقة من Meta، والتي تم إصدارها كنماذج "ذات وزن مفتوح" - مما يعني أنه يمكن لأي شخص تنزيل النماذج مجانًا وتشغيلها على أجهزته الخاصة، بالإضافة إلى تعديلها وضبطها حسب رغبته - يعد Muse Spark، على الأقل في الوقت الحالي، في المقام الأول أداة داخلية لـ Meta.
يعمل النموذج حاليًا على تشغيل مساعد Meta AI في تطبيق Meta AI المستقل الخاص بالشركة وعلى meta.ai. وقالت الشركة إنها ستطرحها على WhatsApp وInstagram وFacebook وMessenger ونظارات Meta’s Ray-Ban AI في الأسابيع المقبلة. وقالت أيضًا إنها ستقدم النموذج في "معاينة خاصة" لاختيار الشركاء من خلال واجهة برمجة التطبيقات (API.) وهذا يجعل Muse Spark أكثر ملكية من نماذج الملكية المدفوعة التي يقدمها منافسو Meta. (قالت شركة ميتا في منشور بالمدونة إنها تأمل في أن تكون الإصدارات المستقبلية من النموذج مفتوحة المصدر.)
يعد Muse Spark أول نموذج تفكير لـ Meta، مما يعني أنه يمكنه العمل من خلال عملية بطريقة خطوة بخطوة، باستخدام استراتيجيات مختلفة إذا لم ينجح نهجه الأولي. تم تصميم جميع النماذج السابقة للشركة لإنتاج إجابة فورية بناءً على تدريب النموذج. يعد Muse Spark أيضًا نموذجًا متعدد الوسائط يمكنه استيعاب وإخراج النص والصور. ويدعم النموذج أيضًا استخدام أدوات برمجية أخرى ويمكن أن يساعد في تنسيق عمل الوكلاء الفرعيين المتعددين، وفقًا لمنشور مدونة تقني صادر عن Meta.
في منشور المدونة للإعلان عن النموذج الجديد، تصف Meta Muse Spark بأنه "صغير وسريع التصميم، ولكنه قادر بما يكفي على حل الأسئلة المعقدة في العلوم والرياضيات والصحة." ويصف النموذج بأنه الأول في سلسلة من النماذج الجديدة، مع استخدام Muse Spark للتحقق من صحة البنية ونظام التدريب الذي تستخدمه Meta، قبل أن تقوم الشركة بتوسيع نطاق هذا إلى نماذج أكبر وأكثر قوة في نفس العائلة.
يحتوي النموذج أيضًا على وضع "التأمل" أو "التفكير" الذي يمكنه من خلاله تدوير الوكلاء الفرعيين للتفكير في أجزاء مختلفة من المهمة بالتوازي. وقالت Meta في مدونة تقنية نشرتها عن النموذج الجديد إن هذا الوضع يسمح لـ Muse Spark "بالتنافس مع أنماط التفكير المتطرف للنماذج الحدودية مثل Gemini Deep Think وGPT Pro."
ترسم النتائج المعيارية المنشورة جنبًا إلى جنب مع عملية الإطلاق صورة لنموذج تنافسي ولكنه غير مهيمن. على سبيل المثال، في اختبار GPQA Diamond، والذي من المفترض أن يختبر مهارة الاستدلال على مستوى الدكتوراه، سجل Muse Spark 89.5%، وهو ما يتخلف قليلاً عن كل من Gemini 3.1 Pro الذي حصل على 94.3% وكذلك 92.7% و92.8% التي سجلها Claude Opus 4.6 من Anthropic وGPT-5.4 من OpenAI على التوالي. في أحد المعايير الصحية الرائدة، HealthBench Hard، تغلب Muse Spark على جميع الطرز المنافسة بنتيجة 42.8%، وهو ما كان أفضل بكثير من Opus 4.6 أو Gemini 3.1 Pro، وأفضل قليلاً من GPT-5.4.
اعترفت Meta بوجود فجوات في الأداء. ينص منشور مدونتها الفنية على أن الشركة تواصل "الاستثمار في المجالات التي بها فجوات الأداء الحالية،