أطلقت شركة OpenAI نموذجًا جديدًا معتمداً على الذكاء الاصطناعي لتوليد الفيديو من المطالبات النصية، ويحمل الاسم Sora.
وقالت الشركة إنّ Sora يستطيع إنشاء مشاهد واقعية أو خيالية من أوامر نصية.
ويسمح Sora للمستخدمين إنشاء مقاطع فيديو تبدو واقعية وتصل مدتها إلى دقيقة واحدة.
كما أنه قادر على إنشاء مشاهد معقدة بشخصيات متعددة، وأنواع محددة من الحركة، وتفاصيل دقيقة للموضوع والخلفية، بحسب ما كشفته الشركة.
وأشارت الشركة أيضًا إلى أن النموذج يمكنه فهم كيفية وجود الأشياء في العالم المادي، بالإضافة إلى إمكانية إنشاء شخصيات مقنعة مع مشاعر نابضة بالحياة بحسب وصف الشركة.
يمكن للنموذج أيضًا إنشاء مقطع فيديو استنادًا إلى صورة ثابتة، بالإضافة إلى ملء الإطارات المفقودة في مقطع فيديو موجود مسبقاً.
تتضمن العروض التوضيحية التي أنشأها Sora والمضمنة في منشور مدونة OpenAI مشهدًا جويًا لولاية كاليفورنيا، ومقطع فيديو يبدو كما لو تم تصويره من داخل قطار طوكيو وغيرها، ويمكن مشاهدتها جميعاً هنا.
لدى العديد منها بعض العلامات الواضحة للذكاء الاصطناعي – مثل أرضية متحركة بشكل مثير للريبة في مقطع فيديو لمتحف، حيث قالت الشركة إن النموذج قد يواجه صعوبة في المحاكاة الدقيقة لفيزياء مشهد معقد، لكن النتائج بشكل عام مثيرة للإعجاب للغاية.
ويتوفر Sora حاليًا فقط لما يعرف باسم “أعضاء الفريق الأحمر” الذين يقومون بتقييم النموذج بحثًا عن الأضرار والمخاطر المحتملة.
يوفر OpenAI أيضًا إمكانية الوصول إلى بعض الفنانين البصريين والمصممين وصانعي الأفلام للحصول على تعليقات.
مثل منتجات الذكاء الاصطناعي الأخرى، سيتعين على OpenAI أن تتعامل مع عواقب الخلط بين مقاطع الفيديو الواقعية المزيفة والواقعية الحقيقية.