أعلنت شركة OpenAI عن نموذج جديد للذكاء الاصطناعي التوليدي الرائد يوم الاثنين أطلقت عليه اسم GPT-4o.
حيث يرمز الحرف “o” إلى “omni”، في إشارة إلى قدرة النموذج على التعامل مع النصوص والأصوات والصور.
وقالت الشركة إنّ هذا النموذج “أسرع بكثير” ويدعم التعامل مع النصوص والصور والأصوات معاً.
ويتوفر GPT-4o في الاشتراك المجاني من ChatGPT، وللمشتركين في خدمة الاشتراك المدفوعة ChatGPT Plus، والتي توفر حدود رسائل “أعلى بمقدار 5 مرات”.
وقالت الشركة إن بهذا النموذج فإن شات جي بي تي سيكون قادراً على إجراء المحادثات اللفظية في الوقت الفعلي، كأنك تتحدث مع إنسان.
كما سيتمكن المستخدم من إجراء محادثات متطورة، حيث يوفر GPT-4o تفاعلات محادثة “طبيعية” وترجمات والمزيد.
أظهر العرض التوضيحي للشركة موظفي الشركة وهم يطرحون الأسئلة على ChatGPT الصوتي، والذي استجاب بالنكات والمزاح الشبيه بالبشر.
فيما نشر الرئيس التنفيذي للشركة سام ألتمان أن النموذج “متعدد الوسائط” ، مما يعني أنه يستطيع إنشاء المحتوى أو فهم الأوامر عبر كل من الأصوات والنصوص والصور.
ومع تضمين الوضع الصوتي فإن Chat GPT سيكون قادرًا على العمل كمساعد صوتي، حيث يستجيب في الوقت الفعلي.
ولكن سيكون الوضع الصوتي محدود حالياً، ويستجيب لمطالبة واحدة في وقت واحد.
كما ويمكن للمطورين الذين يرغبون في تضمين GPT-4o في تطبيقاتهم الوصول إلى API بنصف السعر وضعف سرعة GPT-4 Turbo..