أعلنت شركة Stability AI عن أحدث نموذج لإنشاء الصور من خلال المطالبات النصية والذي يحمل الاسم Stable Cascade.
وتعد الشركة بأن يكون هذا النموذج أسرع وأقوى من سابقه الرائد Stable Diffusion، والذي يعد حجر الأساس للعديد من أدوات الذكاء الاصطناعي الأخرى المَعنية بتحويل النصوص إلى صور.
ويمكن لـ Stable Cascade إنشاء صور وإعطاء أشكال مختلفة للصورة الواحدة التي تم إنشاءها، أو محاولة زيادة دقة الصورة الموجودة.
تشتمل الميزات الأخرى إمكانية الرسم، وتحرير جزء معين فقط من الصورة، بالإضافة إلى ميزة Canny Edge، والتي تمكّن المستخدمين من إنشاء صورة جديدة فقط باستخدام حواف الصورة الموجودة مسبقاً.
النموذج الجديد متاح على GitHub للباحثين ولكن ليس للاستخدام التجاري، ويجلب المزيد من الخيارات الجديدة.
وعلى عكس نموذج Stable Diffusion الرائد فإن Stable Cascade ليس نموذجًا لغويًا واحدًا كبيرًا، إنما ثلاثة نماذج.
كما يتم في هذا النموذج تقسيم الطلبات إلى أجزاء أصغر والتي تتطلب ذاكرة أقل، وساعات أقل من التدريب عبر وحدات معالجة الرسومات، كما أنه أسرع.
حيث استغرق إنشاء الصورة في إحدى التجارب حوالي 10 ثوانٍ مقارنة بـ 22 ثانية لنموذج SDXL المستخدم حاليًا.