قامت شركة OpenAI بمعاينة مجموعة جديدة من نماذج الذكاء الاصطناعي الاستدلالية الجديدة التي أطلقت عليها اسم o3 و o3-mini.

وعلى الرغم من أن الشركة لم تطلق هذه النماذج رسمياً حيث أنها ما زالت في مرحلة التطوير، إلا أنها تقبل الطلبات المقدمة من مجتمع البحث لاختبار هذه الأنظمة قبل الإصدار العام (الذي لم تحدد موعدًا له بعد).

وكانت الشركة قد أطلقت نموذج o1 (الذي يحمل الاسم الرمزي Strawberry) في سبتمبر/أيلول الماضي، وهي تقفز مباشرة إلى o3، متخطية o2 لتجنب الخلط (أو تعارض العلامات التجارية) مع شركة الاتصالات البريطانية المسماة O2.

أصبح مصطلح الاستدلال كلمة طنانة شائعة في صناعة الذكاء الاصطناعي مؤخرًا، ولكنه يعني في الأساس أن الآلة تقوم بتقسيم التعليمات إلى مهام أصغر يمكن أن تؤدي إلى نتائج أقوى.

غالبًا ما توضح هذه النماذج كيفية وصول العمل إلى الإجابة، بدلاً من مجرد إعطاء إجابة نهائية دون تفسير.

ووفقا للشركة، فإن o3 يتجاوز سجلات الأداء السابقة في جميع المجالات، فهو يتفوق على سابقه في اختبارات البرمجة (التي تسمى SWE-Bench Verified) بنسبة 22.8 بالمائة ويتفوق على كبير علماء OpenAI في البرمجة التنافسية.

وكاد النموذج أن ينجح في واحدة من أصعب مسابقات الرياضيات (تسمى AIME 2024)، وفشل في الحصول على سؤال واحد، وحقق 87.7% في معيار المسائل العلمية على مستوى الخبراء (يُسمى GPQA Diamond).

ونجح o3 في حل 25.2 بالمائة من المشكلات (حيث لا يتجاوز أي نموذج آخر 2 بالمائة) في أصعب تحديات الرياضيات والاستدلال التي عادةً ما تعترض الذكاء الاصطناعي.

مقالات قد تعجبك

إنستغرام تخطط لإضافة ميزة لتحرير الفيديو بالاعتماد على الذكاء الاصطناعي
جوجل تختبر نموذج استدلالي جديد للذكاء الاصطناعي Gemini 2.0 Flash Thinking
الكشف عن المقطع الدعائي الأول للفيلم المنتظر Superman 2025
إنستغرام ستسمح لمستخدميها بتجميع لحظاتهم المفضلة في 2024
هل وسائل القفل الحيوية (البصمة والوجه) قوية؟

شاركها.
yalla shoot
أهم مباريات اليوم
يلا شوت
سيما فري
سيما فور يو
شات فلسطين
شات سوريا
شات ليبيا
شات سوريا
كاشف الذهب
دراما كافيه
Exit mobile version