أعلنت شركة ميتا عن تقنية جديدة لإنشاء الفيديو بالذكاء الاصطناعي بالاعتماد على التعليمات النصية ليكون منافساً لنموذج Sora من OpenAI.
وتحمل هذه التقنية اسم Movie Gen وتنتج لقطات عالية الوضوح مع الصوت المناسب لها.
ويستخدم نموذج Movie Gen المدخلات النصية لإنشاء مقاطع فيديو جديدة تلقائيًا، بالإضافة إلى تحرير اللقطات الموجودة أو الصور الثابتة.
كما أن الصوت المضاف إلى مقاطع الفيديو يتم إنشاؤه أيضًا بواسطة الذكاء الاصطناعي، مما يطابق الصور مع الضوضاء المحيطة والمؤثرات الصوتية وموسيقى الخلفية.
كما ويمكن إنشاء مقاطع الفيديو بنسب عرض إلى ارتفاع مختلفة.
بالإضافة إلى إنشاء مقاطع جديدة، يقول Meta إن Movie Gen يمكنه أيضًا إنشاء مقاطع فيديو مخصصة من الصور أو تحرير مقطع فيديو موجود وتغيير عناصر مختلفة منه.
يُظهر أحد الأمثلة التي شاركتها الشركة لقطة ثابتة لرأس امرأة؛ الفيديو المضاف يصورها وهي جالسة على رقعة يقطين وهي تحتسي مشروبًا.
يمكن أيضًا استخدام Movie Gen لتحرير اللقطات الموجودة وتغيير النمط والانتقالات أو إضافة أشياء لم تكن موجودة من قبل.
قالت شركة ميتا إن الشركة ليست مستعدة حالياً لإصدار هذا النموذج كمنتج في الوقت القريب لأنه لا يزال مكلفًا ويحتاج وقت طويل للإنشاء.
وتثير مولدات الصور المدعمة بالذكاء الاصطناعي مخاوف بشأن الملكية وحالات الاستخدام الضارة المحتملة، وبالتأكيد ستؤدي مولدات الفيديو المدعمة بالذكاء الاصطناعي إلى تفاقمها.
وأشارت تقارير سابقة إلى أنّ شركة Runaway الناشئة للذكاء الاصطناعي قامت بتدريب مولد الفيديو الخاص بها على آلاف مقاطع الفيديو المسروقة من يوتيوب YouTube.
وقالت شركة ميتا في منشور في مدونتها إنها قامت بتدريب هذا النموذج على “مجموعة من مجموعات البيانات المرخصة والمتاحة للجمهور” لكنها لم تحدد أي منها.