أعلنت شركة جوجل عن تحديث نموذج الذكاء الاصطناعي Gemini 1.5 Pro ليتمكن الآن من الاستماع إلى الملفات الصوتية وفهمها وتلخيصها.
وأعلنت جوجل عن ذلك خلال حدث Google Next، كما ذكرت أنها ستجعل Gemini 1.5 Pro متاحًا للجمهور لأول مرة من خلال منصتها لبناء تطبيقات الذكاء الاصطناعي Vertex AI.
إنّ هذا الإصدار الجديد من Gemini Pro، والذي من المفترض أن يكون الطراز المتوسط لعائلة Gemini، يتفوق بالفعل على الطراز الأكبر والأقوى Gemini Ultra في الأداء.
حيث تدّعي شركة جوجل Google أنّ Gemini 1.5 Pro يمكنه فهم التعليمات المعقدة ويلغي الحاجة إلى ضبط النماذج بدقة.
ولكن لسوء الحظ فإن Gemini 1.5 Pro غير متاح للأشخاص الذين ليس لديهم إمكانية الوصول إلى Vertex AI وAI Studio.
في الوقت الحالي يستخدم معظم الأشخاص نماذج Gemini من خلال برنامج Gemini chatbot.
كما حصل نموذج تحويل النص إلى صورة Imagen 2 على ميزات جديدة والتي من شأنها أن تعزز إمكانات إنشاء الصور في Gemini.
حيث سيتضمن الآن إمكانيات الرسم الداخلي والرسم الخارجي، مما يتيح للمستخدمين إضافة عناصر من الصور أو إزالتها.
كما أتاحت جوجل Google أيضًا ميزة العلامات المائية الرقمية SynthID على جميع الصور التي تم إنشاؤها من خلال نماذج Imagen.
حيث يضيف SynthID علامة مائية غير مرئية للعارض على الصور التي تحدد مصدرها عند عرضها من خلال أداة الكشف.
تقول Google إنها تقوم أيضًا بمعاينة علنية لطريقة ربط استجابات الذكاء الاصطناعي الخاصة بها ببحث Google حتى يتمكنوا من الإجابة بمعلومات محدثة.