أطلقت جامعة محمد بن زايد للذكاء الاصطناعي وشركاؤها نظام الاستدلال مفتوح المصدر K2Think الإصدار الثاني
أطلقت شركة G42، بالتعاون مع شركة Cerebras Systems ومعهد نماذج المؤسسة في جامعة محمد بن زايد للذكاء الاصطناعي، النسخة الثانية من نموذج K2 Think، وهو نظام استدلالي يضم 70 مليار مُعامل. يُعزز هذا الإصدار استراتيجية السيادة التكنولوجية لدولة الإمارات العربية المتحدة، ويُقدم نموذجاً مفتوح المصدر بالكامل، بحسب وصف الشركاء، يشمل البنية والتشغيل وبيانات التدريب والتقييم.
يعتمد الإصدار الثاني من K2Think على K2-V2، وهو النموذج الأكثر كفاءة مفتوح المصدر من معهد نماذج المؤسسة في فئة النماذج المتقدمة. وقد صُممت النواة خصيصًا لدعم أحمال عمل الاستدلال، حيث تجمع بين معالجة السياق الموسّعة، ومواءمة الأداء، والتدريب الشفاف، بحيث يمكن للنظام أن يعمل كنموذج مستقل مع الحفاظ على إمكانية الوصول إليه من قبل الباحثين والمطورين حول العالم.

يُغيّر نموذج K2 Think الجديد بنية أنظمة الاستدلال المفتوحة، إذ ينتقل من طبقة استدلال منفصلة إلى قدرة استدلال مُدمجة داخل النموذج الأساسي. وهو مُصمّم لمعالجة المسائل المعقدة خطوة بخطوة، وبناء "سلاسل فكرية طويلة" عبر مجالات مثل الرياضيات والعلوم والبرمجة والمنطق والمحاكاة، مستفيدًا من نقاط قوة K2-V2 الكامنة في السياق الطويل.
يُوصَف هذا النهج بأنه تصميم "يعتمد على الاستدلال أولاً"، حيث يُحسَّن النظام بأكمله للاستدلال بدلاً من مجرد توليد النصوص العامة. يُمكِّن طول السياق الممتد الإصدار الثاني من K2Think من الاحتفاظ بالمعلومات ذات الصلة نشطة لفترات أطول، مما يدعم الاستدلال متعدد الخطوات عبر مدخلات معرفية كبيرة ويساعد في الحفاظ على التماسك عند تحليل المواد التقنية المعقدة.
يستمد الإصدار الثاني من K2Think قدراته من أحدث نموذج أساسي طُوّر في معهد نماذج المؤسسات، وهو K2-V2، الذي يُشكّل أساس النظام بأكمله. صُمّم K2-V2 لدعم الاستدلال طويل المدى، والسلوك المُراعي للسياق، والتوافق مع أهداف الأداء، مما يرفع سقف التوقعات لما يُمكن لنظام استدلال مفتوح المصدر بهذا الحجم تحقيقه ضمن فئة نماذج متقدمة.
أفاد مطورو النموذج أن الإصدار الثاني من K2Think يحقق نتائج متميزة في العديد من معايير الاستدلال المعقدة مقارنةً بأنظمة الاستدلال مفتوحة المصدر الأخرى، مثل AIME2025 وGPQA-Diamond وHMMT وIFBench. وتُبرز هذه النتائج أداءه المتميز في المهام التي تتطلب معالجة منطقية متعددة الخطوات بدلاً من إكمال الأنماط البسيطة.
| المعيار | مجال التركيز | الدور المُعلن عنه لإصدار K2Think 2 |
|---|---|---|
| AIME2025 | الاستدلال الرياضي المتقدم | يُستخدم لتقييم الاستدلال الرياضي المعقد |
| GPQA-Diamond | الإجابة على أسئلة على مستوى الدراسات العليا | يقيس الأداء في الاستعلامات العلمية عالية الصعوبة |
| HMMT | حل المسائل الرياضية | تقييم مهارات حل المشكلات متعددة الخطوات |
| IFBench | تقييم الاستدلال | يقيس القدرات العامة للاستدلال |
الشفافية، ومجموعات البيانات، وسيادة الإمارات العربية المتحدة - الإصدار الثاني من K2Think
تم تدريب الإصدار الثاني من نموذج K2 Think على مجموعة بيانات مستقلة تمامًا جمعها معهد نماذج المؤسسة. ويعتمد التدريب فقط على مجموعات بيانات داخلية تم إعدادها وتنظيفها، بما في ذلك مجموعة Guru، التي تم تنقيتها بشكل كبير من مقاييس ما بعد الاختبار لتوفير تقييمات عادلة وقابلة للتكرار لسلوك النموذج.
تُعدّ الشفافية هدفًا تصميميًا أساسيًا لإصدار K2Think الثاني، حيث تُتاح جميع مراحل التطوير للفحص. ويمكن لمجتمع البحث والتطوير فحص المكونات، بدءًا من مجموعات البيانات قبل التدريب ونقاط التحقق الوسيطة، وصولًا إلى منهجيات ما بعد التدريب وسير عمل التقييم، وإعادة استخدامها أو توسيعها، مما يدعم التحقق العلمي وإعادة إنتاج النتائج بشكل مستقل.
تهدف الشفافية الكاملة لإصدار K2Think الثاني، بما في ذلك بنيته، ومعالجة البيانات، وأساليب تنقية البيانات، ووصفات التدريب، وعمليات الاستدلال، إلى دعم أهداف دولة الإمارات العربية المتحدة الوطنية المتعلقة بالسيادة في مجال الذكاء الاصطناعي. وفي الوقت نفسه، يظل النموذج متاحًا عالميًا، مما يضع مؤسسات دولة الإمارات العربية المتحدة ضمن مجموعة الدول التي تُطوّر أنظمة ذكاء اصطناعي واسعة النطاق ومفتوحة المصدر.
بفضل دمج نواة K2-V2 التي تضم 70 مليار مُعامل، وبنية "الاستدلال أولاً"، والاستدلال السياقي الطويل، وخطوط المعالجة المكشوفة بالكامل، يُقدّم الإصدار الثاني من نموذج K2 Think نظام استدلال مفتوح المصدر، يتميّز بتقدّمه التقني وقابليته للتدقيق المستقل. يُعزّز هذا الإصدار أهداف السيادة الوطنية، ويُزوّد مجتمع الذكاء الاصطناعي الدولي بمورد شفاف للبحث والتطوير.
With inputs from WAM