لقد مرت ثلاثة أشهر منذ أن قامت شركة OpenAI بالكشف عن نموذج الذكاء الاصطناعي الذي يُنشئ فيديو من المطالبات النصية والذي أسمته Sora.
والآن تحاول جوجل Google المنافسة من خلال إعلان نموذج جديد.
حيث كشفت الشركة في مؤتمر المطورين I/O يوم الثلاثاء عن نموذج Veo، وهو أحدث نموذج فيديو لها بتقنية الذكاء الاصطناعي.
ويستطيع هذا النموذج إنشاء مقاطع فيديو عالية الجودة بدقة 1080 بكسل مدتها دقيقة واحدة بمجموعة واسعة من الأنماط المرئية والسينمائية.
ويتمتع Veo بفهم متقدم للغة الطبيعية، وفقًا للبيان الصحفي الصادر عن Google، مما يمكّن النموذج من فهم المصطلحات السينمائية مثل الفاصل الزمني أو اللقطات الجوية للمناظر الطبيعية.
يمكن للمستخدمين أيضاً توجيه المخرجات المطلوبة باستخدام النصوص أو الصور أو المطالبات المستندة إلى الفيديو.
وتقول Google إن مقاطع الفيديو الناتجة ‘أكثر اتساقًا وتماسكًا’، وتصور حركة أكثر واقعية للأشخاص والحيوانات والأشياء خلال اللقطات.
كما هو الحال مع العديد من معاينات نماذج الذكاء الاصطناعي هذه، فمن المرجح أن يضطر معظم الأشخاص الذين يأملون في تجربة Veo بأنفسهم إلى الانتظار لبعض الوقت.
وقالت جوجل إنها دعت صانعي الأفلام والمبدعين المختارين لتجربة النموذج لتحديد من أجل إبداء الرأي، وليكون لهم دور في تطوير تقنيات الذكاء الاصطناعي من Google.
ويعتبر Veo أحد نماذج توليد الفيديو العديدة التي أنتجتها جوجل على مدار السنوات القليلة الماضية، بدءًا من Phenaki و Imagen Video، اللذين أنتجا مقاطع فيديو بدائية ومشوهة في كثير من الأحيان، إلى نموذج Lumiere الذي عرضته في يناير من هذا العام.
كان هذا الأخير واحدًا من أكثر النماذج إثارة للإعجاب التي رأيناها قبل الإعلان عن Sora في فبراير، حيث قالت Google إن Veo أكثر قدرة على فهم ما هو موجود في الفيديو، ومحاكاة فيزياء العالم الحقيقي، وتقديم مخرجات عالية الوضوح، والمزيد.