أطلقت شركة OpenAI رسمياً نموذج توليد الصور ChatGPT Images 2.0، وذلك بعد حوالي العام تقريباً على إطلاق الإصدار الأول منه.
ووصفت الشركة النظام الجديد بأنه “نقلة نوعية” لنماذج توليد الصور، لا سيما فيما يتعلق بقدرة الأداة على اتباع التعليمات بدقة، وعرض النصوص الكثيفة، ووضع العناصر وربطها في المشهد.
ولأول مرة، طورت OpenAI نموذج صور يتمتع بقدرات استدلالية، مما يمنح النظام القدرة على القيام بأمور مثل البحث في الإنترنت والتحقق من مخرجاته.
ووفقًا للشركة، من شأن هذه القدرات أن تُترجم إلى أداة أكثر موثوقية عندما تكون الدقة والاتساق والتماسك البصري أمورًا أساسية.

وأعلنت OpenAI أنها بذلت جهودًا كبيرة لتحسين أداء Images 2.0 في فهم وعرض النصوص غير اللاتينية، مع تحقيق “مكاسب ملحوظة” في قدرة النموذج على التعامل مع اللغات اليابانية والكورية والصينية والهندية والبنغالية.
وفي الوقت نفسه، تدّعي الشركة أن النموذج الجديد أكثر دقة في محاكاة الخصائص المميزة للغات البصرية المختلفة.
وتؤكد OpenAI أن هذا يجعل Images 2.0 أكثر فائدة في مهام مثل تصميم نماذج الألعاب ورسم القصص المصورة.
إلى جانب هذه الميزات، يتميز النموذج الجديد بمرونة أكبر فيما يتعلق بنسب العرض إلى الارتفاع، مما يسمح له بإنشاء صور بعرض يصل إلى 3:1 وارتفاع يصل إلى 1:3.
كما يمكنه إنتاج تصاميم بدقة تصل إلى 2K، بل ويمكنه توليد ما يصل إلى ثمانية مخرجات في عملية واحدة.

وسيتوفر نموذج Images 2.0 ابتداءً من اليوم لجميع مستخدمي ChatGPT، بما في ذلك المشتركين في الباقة المجانية وباقة Go.
ويحصل مشتركو باقتي Plus وPro على إمكانية الوصول إلى مخرجات أكثر تطورًا. كما تُتيح OpenAI النموذج عبر خدمة API وتطبيق Codex البرمجي، الذي تم تحديثه الأسبوع الماضي ليُوفر ميزة توليد الصور المدمجة.
والجدير بالذكر أن Images 2.0 تأتي بعد أيام قليلة من دخول Anthropic سوق التصميم المرئي بمساعد التصميم الخاص بها.


