شركة Runway تكشف عن أحدث نموذج لإنشاء الفيديو من الأوامر النصية

أعلنت شركة الذكاء الاصطناعي Runway عن أحدث نماذجها لتوليد الفيديو من النصوص وهو الجيل 4.5 الذي يُنتج صورًا أكثر دقة من الجيل السابق.

وقالت الشركة إن نموذجها من الجيل 4.5 قادر على إنتاج “مخرجات سينمائية وواقعية للغاية”، مما قد يُصعّب التمييز بين الواقع والذكاء الاصطناعي.

وأفادت Runway في إعلانها: “يحقق الجيل 4.5 دقة فيزيائية وبصرية غير مسبوقة”. وأضافت أن نموذج الذكاء الاصطناعي الجديد أفضل في الاستجابة للطلبات، مما يسمح له بإنتاج مشاهد مفصلة دون المساس بجودة الفيديو.

وأكّدت الشركة أنّ الأجسام المُولّدة بالذكاء الاصطناعي “تتحرك بوزن وزخم وقوة واقعية”، بينما “تتدفق السوائل بديناميكيات مناسبة”.

سيتم طرح نموذج الجيل 4.5 لجميع المستخدمين تدريجيًا، وسيوفر نفس سرعة وكفاءة سابقه، وفقًا لـ Runway.

مع ذلك، لا تزال هناك بعض القيود، إذ قد يواجه النموذج مشاكل في ثبات الأشياء والاستدلال السببي، مما يعني أن التأثيرات قد تحدث قبل السبب، مثل فتح الباب قبل استخدام المقبض.

وقالت الشركة إن نموذجها الجديد أفضل في التعامل مع الأنماط المرئية المختلفة أيضًا، مما يسمح له بإنتاج صور أكثر اتساقًا وواقعية وأسلوبية وسينمائية.

تدعي الشركة الناشئة أن الصور المرئية الواقعية التي تم إنشاؤها باستخدام Gen-4.5 يمكن أن تكون “غير قابلة للتمييز عن لقطات العالم الحقيقي مع تفاصيل ودقة واقعية”.

مقالات قد تعجبك

روبوتات الدردشة ChatGPT و Copilot ستغادر واتساب قريباً
شركة بلاك شارك تكشف عن ساعة GS3 Ultra المتينة
الكشف عن تسريبات حول هاتف Xiaomi 17 Ultra
هواوي تطلق سلسلة هواتفها الجديدة Mate 80

شركة Runway تكشف عن جيل جديد من نموذج توليد الفيديو المعتمد على الذكاء الاصطناعي

صرحت شركة Runway الناشئة في مجال الذكاء الاصطناعي عن الجيل الجديد Gen-4 من نموذج توليد الفيديو الخاص بها، والذي يستطيع توليد مشاهد متعددة المقاطع ومتناسقة بالسرد القصصي ودون تشويه بحسب الشركة.

وكما هو معروف فإن مقاطع الفيديو المُولّدة بالذكاء الاصطناعي تواجه صعوبة في الحفاظ على اتساق سرد القصص، لكن Runway تزعم على منصة X أن النموذج الجديد، الجيل الرابع، من شأنه أن يمنح المستخدمين مزيدًا من “الاستمرارية والتحكم” أثناء سرد القصص.

يسمح نموذج توليد الفيديو الجديد من الجيل الرابع، المُتاح حاليًا للمستخدمين المدفوعين والمُؤسسات، للمستخدمين بتوليد شخصيات وأشياء عبر اللقطات باستخدام صورة مرجعية واحدة.

يجب على المستخدمين بعد ذلك وصف التكوين الذي يريدونه، وسيُولّد النموذج بعد ذلك مخرجات متسقة من زوايا متعددة.

على سبيل المثال، أصدرت الشركة الناشئة فيديو لامرأة تُحافظ على مظهرها في لقطات وسياقات مُختلفة في ظروف إضاءة مُتنوعة.

الإصدار الجديد يأتي بعد أقل من عام من إعلان شركة “Runway” عن نموذجها السابق “Gen-3 Alpha” لإنشاء الفيديوهات.

ذلك النموذج سمح بتمديد مدة الفيديوهات التي يمكن للمستخدمين إنتاجها، لكنه أثار جدلاً واسعًا، حيث وردت تقارير تفيد بأنه قد تم تدريبه على آلاف الفيديوهات المستخرجة من “يوتيوب” وأفلام مقرصنة.

مقالات قد تعجبك

مايكروسوفت تزيل طريقة شائعة لإعداد ويندوز 11 دون اتصال بالإنترنت
مايكروسوفت تختبر ميزة جديدة لإصلاح حواسيب ويندوز 11 عن بعد
فيس بوك يختبر تبويب جديد لعرض قصص ومنشورات الأصدقاء فقط
كيفية استخدام وضع اليد الواحدة في أندرويد
كيفية تعيين نظام التشغيل الافتراضي على كمبيوتر يعمل بنظامي تشغيل

شركة ناشئة تروج لتقنية جديدة لإنشاء مقاطع الفيديو من وصف نصي

يبدو أن التطور في مجال الذكاء الاصطناعي لن يتوقف، فبعد أن دخل عدد كبير من الشركات الكبرى في هذا المجال، هاهي بعض الشركات الناشئة تدخل المجال وتنافس فيه أيضاً.

حيث أعلنت شركة ناشئة تدعى Runway عن نموذج جديد لإنشاء الفيديو من الوصف النصي وبالاعتماد على الذكاء الاصطناعي.

يتمثل هدف هذه التقنية في أن يكتب المستخدم وصفاً نصياً لما يريد إنشاؤه، ليقوم الذكاء الاصطناعي بإنشاء مقطع فيديو مطابق.

وتقدم Runway محرر فيديو على شبكة الإنترنت متخصص في أدوات الذكاء الاصطناعي، مثل إزالة الخلفية واكتشاف الوضع.

كما ساعدت الشركة في تطوير نموذج مفتوح المصدر لتحويل النص إلى صورة Stable Diffusion، وأعلنت عن أول نموذج لتحرير الفيديو بالذكاء الاصطناعي Gen-1 في شهر فبراير/شباط الماضي.

وركز Gen-1 على تحويل لقطات الفيديو الموجودة، مما يسمح للمستخدمين بإدخال رسوم متحركة ثلاثية الأبعاد تقريبية وتطبيق تراكب بواسطة الذكاء الاصطناعي AI.

في المقطع أدناه على سبيل المثال يتم إقران لقطات من عبوات من الورق المقوى بصورة لمصنع صناعي لإنتاج مقطع يمكن استخدامه في إنشاء القصص المصورة أو الترويج لمنتج.

https://twitter.com/stopsatgreen/status/1636042802168578058

بالمقارنة يبدو أن الميزة الجديدة Gen-2 تركز أكثر على إنشاء مقاطع فيديو من البداية، على الرغم من وجود الكثير من العيوب في الوقت الحالي.

مثال على فيديو تم إنشاؤه بواسطة نموذج Runway Gen-2. كانت مطالبة إدخال النص هي ‘لقطة بعد متنزه عبر فرشاة الغابة’. المصدر: Runway

أولاً المقاطع التوضيحية التي شاركتها الشركة قصيرة وغير مستقرة، وبالتأكيد ليست واقعية، وثانيًا الوصول إليها محدود.

تم إنشاء فيديو AI باستخدام Gen-2 مع المطالبة ‘لقطة قريبة للعين’. المصدر: Runway

ذكرت بلومبرج نيوز أنه سيتعين على المستخدمين التسجيل للانضمام إلى قائمة انتظار Gen-2، فيما قال المتحدث باسم الشركة، كيلسي روندينت، لموقع The Verge أن Runway سيوفر وصولاً واسع النطاق في الأسابيع المقبلة.

فيديو تم إنشاؤه بواسطة الذكاء الاصطناعي باستخدام المطالبة الفورية ‘لقطة جوية لمنظر طبيعي للجبال. المصدر: Runway

ختاماً تواصل الشركات الناشئة القيام بعمل مثير في مجال الذكاء الاصطناعي التوليدي، بما في ذلك المنطقة التي لم يتم استكشافها بعد من تحويل النص إلى فيديو.

مقالات قد تعجبك

سعر ومواصفات هاتف <strong>Honor 70 Lite</strong>
سامسونج تكشف عن حاملين مميزين لسلسلة هواتف <strong>Galaxy S23</strong>
ميتا توفر خدمة توثيق الحساب المدفوعة لعدد أكبر من المستخدمين
كيفية إلغاء إرسال (استدعاء) بريد إلكتروني في آوت لوك
كيفية استخدام جهاز أندرويد اللوحي بديلاً لجهاز الكمبيوتر المحمول