قامت شركة OpenAI بمعاينة مجموعة جديدة من نماذج الذكاء الاصطناعي الاستدلالية الجديدة التي أطلقت عليها اسم o3 و o3-mini.
وعلى الرغم من أن الشركة لم تطلق هذه النماذج رسمياً حيث أنها ما زالت في مرحلة التطوير، إلا أنها تقبل الطلبات المقدمة من مجتمع البحث لاختبار هذه الأنظمة قبل الإصدار العام (الذي لم تحدد موعدًا له بعد).
وكانت الشركة قد أطلقت نموذج o1 (الذي يحمل الاسم الرمزي Strawberry) في سبتمبر/أيلول الماضي، وهي تقفز مباشرة إلى o3، متخطية o2 لتجنب الخلط (أو تعارض العلامات التجارية) مع شركة الاتصالات البريطانية المسماة O2.
أصبح مصطلح الاستدلال كلمة طنانة شائعة في صناعة الذكاء الاصطناعي مؤخرًا، ولكنه يعني في الأساس أن الآلة تقوم بتقسيم التعليمات إلى مهام أصغر يمكن أن تؤدي إلى نتائج أقوى.
غالبًا ما توضح هذه النماذج كيفية وصول العمل إلى الإجابة، بدلاً من مجرد إعطاء إجابة نهائية دون تفسير.
ووفقا للشركة، فإن o3 يتجاوز سجلات الأداء السابقة في جميع المجالات، فهو يتفوق على سابقه في اختبارات البرمجة (التي تسمى SWE-Bench Verified) بنسبة 22.8 بالمائة ويتفوق على كبير علماء OpenAI في البرمجة التنافسية.
وكاد النموذج أن ينجح في واحدة من أصعب مسابقات الرياضيات (تسمى AIME 2024)، وفشل في الحصول على سؤال واحد، وحقق 87.7% في معيار المسائل العلمية على مستوى الخبراء (يُسمى GPQA Diamond).
ونجح o3 في حل 25.2 بالمائة من المشكلات (حيث لا يتجاوز أي نموذج آخر 2 بالمائة) في أصعب تحديات الرياضيات والاستدلال التي عادةً ما تعترض الذكاء الاصطناعي.