أطلقت جوجل ديب مايند DeepMind إصدارًا جديدًا من نموذج “العالم” المُدمج بالذكاء الاصطناعي، يُسمى Genie 3، القادر على توليد بيئات ثلاثية الأبعاد يُمكن للمستخدمين ووكلاء الذكاء الاصطناعي التفاعل معها آنيًا.
كما تَعِد الشركة المستخدمين بالتفاعل مع العوالم لفترة أطول بكثير من ذي قبل، وبأن النموذج سيتذكر مواقع الأشياء عند إبعاد النظر عنها.
وتعتبر نماذج العالم هي نوع من أنظمة الذكاء الاصطناعي التي تُحاكي البيئات لأغراض مثل التعليم والترفيه، أو للمساعدة في تدريب الروبوتات أو وكلاء الذكاء الاصطناعي.
باستخدام نماذج العالم، تُعطيها مُحفزًا، فتُنشئ مساحة يُمكنك التحرك فيها كما في ألعاب الفيديو، ولكن بدلًا من إنشاء العالم يدويًا باستخدام أصول ثلاثية الأبعاد، يتم توليده بالكامل باستخدام الذكاء الاصطناعي.
يبدو أن جيني 3 سيكون خطوةً مهمةً للأمام، حيث سيتمكن المستخدمون من إنشاء عوالم باستخدام موجه يدعم “بضع دقائق” من التفاعل المستمر، وهو ما يزيد عن 10-20 ثانية من التفاعل الممكن في جيني 2.
وقالت جوجل إن جيني 3 يمكنه الاحتفاظ بالمساحات في الذاكرة البصرية لمدة دقيقة تقريبًا، مما يعني أنه إذا ابتعدتَ عن شيء ما في عالم ما ثم عدت إليه، فستجد أشياءً مثل الطلاء على الحائط أو الكتابة على السبورة في نفس المكان، وستتمتع العوالم أيضًا بدقة 720 بكسل وستعمل بمعدل 24 إطارًا في الثانية.
وأضافت DeepMind أيضًا ما تُسميه “أحداثًا عالمية قابلة للتوجيه” إلى Genie 3. باستخدام مُوجِّه، ستتمكن من القيام بأشياء مثل تغيير أحوال الطقس في عالم ما أو إضافة شخصيات جديدة.
وسيتم إطلاق هذا النموذج كـ”معاينة بحثية محدودة” متاحة “لمجموعة صغيرة من الأكاديميين والمبدعين” ليتمكن مطوروه من فهم المخاطر بشكل أفضل وكيفية الحد منها بشكل مناسب، وفقًا لجوجل.
وهناك أيضًا العديد من القيود، مثل الطرق المحدودة التي يُمكن للمستخدمين من خلالها التفاعل مع العوالم المُولّدة، وأن النص المقروء “غالبًا ما يُولّد فقط عند تقديمه في وصف العالم المُدخل”، وقالت جوجل إنها “تستكشف” كيفية توفير Genie 3 “لمختبرين إضافيين” لاحقًا.