شركة OpenAI تطلق الإصدار الجديد من نموذج توليد الصور الخاص بها Images 2.0

أطلقت شركة OpenAI رسمياً نموذج توليد الصور ChatGPT Images 2.0، وذلك بعد حوالي العام تقريباً على إطلاق الإصدار الأول منه.

ووصفت الشركة النظام الجديد بأنه “نقلة نوعية” لنماذج توليد الصور، لا سيما فيما يتعلق بقدرة الأداة على اتباع التعليمات بدقة، وعرض النصوص الكثيفة، ووضع العناصر وربطها في المشهد.

ولأول مرة، طورت OpenAI نموذج صور يتمتع بقدرات استدلالية، مما يمنح النظام القدرة على القيام بأمور مثل البحث في الإنترنت والتحقق من مخرجاته.

ووفقًا للشركة، من شأن هذه القدرات أن تُترجم إلى أداة أكثر موثوقية عندما تكون الدقة والاتساق والتماسك البصري أمورًا أساسية.

وأعلنت OpenAI أنها بذلت جهودًا كبيرة لتحسين أداء Images 2.0 في فهم وعرض النصوص غير اللاتينية، مع تحقيق “مكاسب ملحوظة” في قدرة النموذج على التعامل مع اللغات اليابانية والكورية والصينية والهندية والبنغالية.

وفي الوقت نفسه، تدّعي الشركة أن النموذج الجديد أكثر دقة في محاكاة الخصائص المميزة للغات البصرية المختلفة.

وتؤكد OpenAI أن هذا يجعل Images 2.0 أكثر فائدة في مهام مثل تصميم نماذج الألعاب ورسم القصص المصورة.

إلى جانب هذه الميزات، يتميز النموذج الجديد بمرونة أكبر فيما يتعلق بنسب العرض إلى الارتفاع، مما يسمح له بإنشاء صور بعرض يصل إلى 3:1 وارتفاع يصل إلى 1:3.

كما يمكنه إنتاج تصاميم بدقة تصل إلى 2K، بل ويمكنه توليد ما يصل إلى ثمانية مخرجات في عملية واحدة.

وسيتوفر نموذج Images 2.0 ابتداءً من اليوم لجميع مستخدمي ChatGPT، بما في ذلك المشتركين في الباقة المجانية وباقة Go.

ويحصل مشتركو باقتي Plus وPro على إمكانية الوصول إلى مخرجات أكثر تطورًا. كما تُتيح OpenAI النموذج عبر خدمة API وتطبيق Codex البرمجي، الذي تم تحديثه الأسبوع الماضي ليُوفر ميزة توليد الصور المدمجة.

والجدير بالذكر أن Images 2.0 تأتي بعد أيام قليلة من دخول Anthropic سوق التصميم المرئي بمساعد التصميم الخاص بها.

مقالات قد تعجبك

إنتل تكشف عن معالجاتها الجديد من سلسلة Core Series 3
سامسونج تطلق رسمياً تشكيلة تلفزيونات Micro RGB لعام 2026 بأحجام متنوعة
ميزة جديدة في يوتيوب لإخفاء مقاطع الفيديو القصيرة Shorts من الصفحة الرئيسية
جوجل ستضيف ميزة الذكاء الشخصي إلى نموذج توليد الصور Nano Banana 2

جوجل تضيف عدة ميزات مدعومة بالذكاء الاصطناعي إلى الشريط الجانبي في متصفح كروم

أضافت شركة جوجل العديد من الأدوات المدعومة بتقنية Gemini إلى متصفح كروم Chrome، حيث سيبدأ طرح مجموعة من الميزات للمتصفح مع المزيد من الإضافات خلال الأشهر القليلة القادمة.

أولى هذه الميزات الجديدة هي الشريط الجانبي والمتوفر لجميع مستخدمي Gemini في Chrome، والذي يمكّن من الدردشة مع Gemini ومواصلة المحادثة عبر عدة علامات تبويب.

وأشارت الشركة إلى أن الشريط الجانبي مفيد لمن يُنجزون مهامًا متعددة في وقت واحد، فمثلاً يمكن مُقارنة الخيارات عبر عدد كبير من علامات التبويب، وتلخيص مُراجعات المنتجات من مواقع مُختلفة، والمساعدة في إيجاد وقتٍ للفعاليات حتى في أكثر الجداول ازدحامًا.

يُمكن أيضًا الوصول إلى الميزة الجديدة الثانية التي أضافتها جوجل إلى متصفح كروم من خلال الشريط الجانبي وهي Nano Banana، مُولّد الصور الخاص بجوجل.

وبفضل هذه الإضافة سيتمكن المستخدم من إنشاء صورة مُعدّلة بالذكاء الاصطناعي مباشرة داخل المتصفح، كما ستسمح بتعديل أي صورة موجودة.

كما تتطلع جوجل إلى إطلاق ميزة “الذكاء الشخصي“، التي ظهرت لأول مرة في تطبيق Gemini في بداية يناير، في متصفح كروم خلال الأشهر القادمة.

بمجرد وصول هذه الميزة، سيتمكّن المتصفح من تذكّر المحادثات السابقة التي أُجريت مع Gemini، وهذا سيؤدي بدوره إلى تجربة كروم أكثر تخصيصًا.

في غضون ذلك، يدعم مساعد جوجل “جيميني” في متصفح كروم ميزة “التطبيقات المتصلة” من جوجل، والتي تتيح للمساعد استخلاص المعلومات من خدمات الشركة الأخرى، بما في ذلك جيميل والتقويم.

أخيرًا وليس آخرًا، تستعرض جوجل ميزة التصفح التلقائي الجديدة في متصفح كروم، في العرض التوضيحي الذي قدمته الشركة، طلب أحد الموظفين من مساعد جوجل “جيميني” البحث عن نفس سترة الشتاء التي اشتراها قبل بضعة مواسم وشرائها له.

قام المساعد أولًا بوضع خطة توضح أفضل طريقة لتلبية الطلب، حيث رأى أن أفضل بداية هي البحث في بريد الموظف الإلكتروني لتحديد طراز ومقاس السترة المناسبين. ثم بدأ عملية التسوق.

أثناء عمل “جيميني” على هذه المهمة، كان بإمكان الموظف مواصلة التصفح في كروم، وفي عدة مراحل من العملية، كان المساعد يتوقف مؤقتًا للحصول على إذن الموظف للمتابعة.

على سبيل المثال، توقف مؤقتًا عندما احتاج إلى بيانات تسجيل الدخول، ومرة ​​أخرى عندما احتاج إلى رقم بطاقة الائتمان لإتمام عملية الشراء.

وأشارت جوجل إلى أن هذه الميزة ستنال إعجاب الأشخاص الذين يفضلون الروتين، على سبيل المثال، عند طلب نفس المنتجات من خدمة توصيل البقالة أسبوعيًا، يمكن لـ”جيميني” أتمتة عملية الطلب.

مقالات قد تعجبك

أدوبي تحدّث أدوات التحرير الخاصة بها في برنامج فوتوشوب
شركة OpenAI تطلق تطبيق Prism لمساعدة الباحثين العلميين
واتساب يضيف وضع أمان متقدم للحماية من الاختراق
كيفية إفراغ سلة المحذوفات تلقائياً في ويندوز 11

شركة OpenAI تكشف عن نموذج توليد الصور ChatGPT Images

كشفت شركة OpenAI يوم أمس عن نموذج ChatGPT Images الجديد والمُحسّن، والذي يتميز بسرعة توليد الصور تفوق سرعة GPT-5.2 بأربعة أضعاف.

من الواضح أن هذا التطوير يهدف إلى منافسة Nano Banana Pro من جوجل، تمامًا كما كان GPT-5.2 ردًا مباشرًا على Gemini 3 Pro.

وقال البيان الصحفي الصادر عن OpenAI إن ChatGPT Images “يُراعي نيتك بدقة أكبر”، فعند طلب التعديلات، “حتى أدق التفاصيل”. فهو يُغيّر فقط ما تطلبه، مع الحفاظ على جميع العناصر الأخرى سليمة في المدخلات والمخرجات والتعديلات اللاحقة.

سيُتيح هذا إمكانية الحصول على نتائج تُطابق ما يريده المستخدم، مما يسمح لـ ChatGPT بأن يكون بمثابة استوديو إبداعي متنقل، قادر على إجراء تعديلات عملية وإعادة ابتكار الصور بأسلوب فني مميز.

يتميز النموذج الجديد بقدرات أفضل في الإضافة والحذف والدمج والمزج والتبديل، مما يُمكّن من الحصول على التغييرات المرغوبة دون فقدان ما يُميز الصورة.

ستتضمن ميزة ChatGPT Images أنماطًا وأفكارًا مُعدة مسبقًا يُمكنك اختيارها دون الحاجة إلى إدخال أي تعليمات كتابية، كما يُطبّق النموذج التعليمات بشكل أكثر دقة، مما يُتيح إجراء تعديلات أكثر دقة وإنشاء تركيبات أصلية أكثر تعقيدًا، مع الحفاظ على العلاقات بين العناصر كما هو مُخطط لها.

من المتوقع أيضًا تحسين عرض النصوص، بالإضافة إلى عرض العديد من الوجوه الصغيرة، وسيتم طرح ميزة ChatGPT Images الجديدة الآن لجميع المستخدمين حول العالم.

مقالات قد تعجبك

آبل تصدر تحديث 26.2 من نظامي iOS و iPadOS
شركة OpenAI تكشف رسمياً عن نموذج الذكاء الاصطناعي GPT-5.2
ريلمي تكشف عن هاتفين جديدين هما Narzo 90 و Narzo 90x
جوجل تجري تحديث شامل لخدمة ترجمة جوجل

مايكروسوفت تكشف عن أول نموذج لها لتوليد الصور من الوصف النصي

أعلنت شركة مايكروسوفت Microsoft عن أول نموذج ذكاء اصطناعي لها لتحويل النص إلى صورة، تحت اسم MAI-Image-1، والذي تم تصميمه وتطويره داخليًا بالكامل.

ووصفت الشركة العملاقة هذا المولّد الجديد بأنه “الخطوة التالية في رحلتنا”، وذلك بعد إعلانها الأخير عن أول نماذج ذكاء اصطناعي داخلية من Microsoft.

وذكرت مايكروسوفت أنها استعانت بآراء محترفين في المجال الإبداعي لتجنب “المخرجات المتكررة أو ذات الطابع النمطي العام”.

وأكّدت الشركة أن MAI-Image-1 يتفوق في إنتاج صور فوتوغرافية واقعية مثل البرق والمناظر الطبيعية وغيرها، كما أنه قادر على معالجة الطلبات وتوليد الصور بسرعة تفوق “النماذج الأكبر والأبطأ”.

وقد حصل النموذج بالفعل على مركز ضمن أفضل 10 نماذج في موقع LMArena، وهو منصة تقييم لنماذج الذكاء الاصطناعي حيث يقارن المستخدمون بين المخرجات ويصوتون لأفضلها.

ينضم MAI-Image-1 إلى منتجات مايكروسوفت الأخرى للذكاء الاصطناعي، وهي مُولّد الصوت MAI-Voice-1 AI وروبوت المحادثة MAI-1-preview.

كانت مايكروسوفت من أوائل الممولين لـ OpenAI، إلا أن العلاقة بينهما ازدادت تعقيدًا، حيث بدأت مايكروسوفت مؤخرًا باستخدام نماذج الذكاء الاصطناعي من Anthropic لبعض ميزات Microsoft 365، وتستثمر بشكل كبير في تدريب نماذج الذكاء الاصطناعي الخاصة بها مثل MAI-Image-1.

مقالات قد تعجبك

تطبيق Sora يتجاوز حاجز المليون تحميل خلال أقل من خمسة أيام من إطلاقه
كروم ستقوم تلقائياً بتعطيل إشعارات المواقع غير المهمة
مايكروسوفت ستطلق تطبيق OneDrive على ويندوز
تطبيق Copilot سيتمكن من إنشاء مستندات أوفيس والربط مع Gmail

نموذج Gemini أصبح قادراً على توليد الفيديوهات من صور ثابتة

أضافت شركة جوجل يوم أمس ميزة جديدة إلى نموذج الذكاء الاصطناعي Veo 3، وهو نموذج إنشاء الفيديو من Gemeni.

ستسمح الميزة الجديدة بتحويل الصور إلى مقاطع فيديو، بمدة أقصاها ثماني ثوانٍ فقط، كما ستتضمن صوتًا أيضًا.

لاستخدام هذه الميزة، اختر “مقاطع الفيديو” من قائمة الأدوات في مربع المطالبة، ثم حمّل صورة، ثم صف المشهد وأضف أي تعليمات لإنشاء الصوت.

هذا كل شيء ومن بعدها سيقوم النموذج بتحويل الصورة إلى فيديو، وبمجرد اكتماله، يمكن بالطبع مشاركتها أو تنزيلها.

يمكن أيضًا استخدام زري الإعجاب والتعليق في مقاطع الفيديو التي أٌنشئت لإبداء الملاحظات لجوجل، والتي ستستخدمها لتحسين التجربة بشكل أكبر.

وبدأت ميزة تحويل الصور إلى مقاطع فيديو بالظهور لمشتركي Google AI Pro و Ultra في دول مختارة حول العالم، كما تتوفر هذه الإمكانيات نفسها في Flow، أداة جوجل لصناعة الأفلام بتقنية الذكاء الاصطناعي.

وقالت جوجل إنه تم إنتاج أكثر من 40 مليون فيديو باستخدام Veo 3 عبر تطبيقي Gemini و Flow خلال الأسابيع السبعة الماضية، ولا شك أن هذه الميزة الجديدة ستزيد هذا العدد بشكل كبير في المستقبل القريب.

تجدر الإشارة إلى أن هذه الفيديوهات المُولّدة بتقنية الذكاء الاصطناعي تتضمن علامة مائية مرئية لإثبات أنها مُولّدة بتقنية الذكاء الاصطناعي، بالإضافة إلى علامة SynthID رقمية غير مرئية.

مقالات قد تعجبك

سامسونج تكشف عن الجيل الجديد من ساعاتها الذكية Galaxy Watch8
جوجل تضيف ميزات جديدة إلى خاصيتي Circle to Search و Gemini Live
شركة OpenAI تعمل على تطوير متصفح ويب خاص بها
كيفية منع جميع المواقع من طلب إرسال الإشعارات في جوجل كروم
كيفية تحديد إن كانت مشاكل الإنترنت من مزود الخدمة أم لا

منصة Canva تكشف عن أداة جديدة لإنشاء صور بالاعتماد على الذكاء الاصطناعي

أضافت منصّة Canva مجموعة من ميزات الذكاء الاصطناعي الجديدة إلى منصتها الأساسية للتصميم على الويب، بما في ذلك التحديثات لإنشاء تأثيرات النص والفيديو وأداة أكثر قوة لتحويل النص إلى صورة.

وأطلقت الشركة على الأداة الأخيرة اسم “Dream Lab” وهي أداة جديدة لإنشاء الصور نشأت نتيجة استحواذ Canva على شركة Leonardo.ai الناشئة للذكاء الاصطناعي في وقت سابق من هذا العام.

يتم تشغيل Dream Lab بواسطة نموذج ليوناردو فينيكس (يجب عدم الخلط بينه وبين Firefly AI من Adobe) ويسمح للمستخدمين بإنشاء صور من الأوصاف في مجموعة متنوعة من الأنماط مثل “العرض ثلاثي الأبعاد” و”التوضيح”.

وتملك كانفا Canva بالفعل مولد صور بالذكاء الاصطناعي قائم على نموذج Stable Diffusion ويستضيف العديد من تطبيقات الطرف الثالث الأخرى، لكن عرض Dream Lab الجديد يقدم بعض التحسينات على النظام الأساسي.

فمثلاً تكون Dream Lab أفضل في إنتاج أنماط التصوير الفوتوغرافي والصور متعددة المواضيع، وتتضمن ميزة يمكنها الرجوع إلى صورة موجودة للتحكم بشكل أفضل في الإخراج – على غرار أداة الصور المرجعية في Photoshop.

كما وأجرت منصة Canva أيضًا بعض التحديثات على مجموعة أدوات الذكاء الاصطناعي “Magic” الأوسع نطاقًا، مثل الدقة المحسنة وأوامر الإكمال التلقائي بنقرة واحدة لميزة إنشاء النص Magic Write.

ستدعم ميزة الألواح البيضاء Whiteboards الآن التلخيص المدعوم بالذكاء الاصطناعي وملصقات التفاعل في الوقت الفعلي للمشاريع التعاونية، كما تمت إضافة أدوات تحرير الفيديو التي تولد التسميات التوضيحية تلقائيًا وتقدم تأثيرات رسوم متحركة جديدة.

يمكن للمستخدمين الآن إضافة مخططات ورسوم بيانية تفاعلية إلى عروضهم التقديمية للمساعدة في تصور البيانات بشكل أفضل.

كما وتم أيضًا توسيع مكتبة أصول Canva بموسيقى ومقاطع فيديو سينمائية جديدة بدون حقوق ملكية بفضل اتفاقية ترخيص مع منصة الموسيقى Artlist.

وكانت منصة كانفا Canva قد أعلنت الشهر الماضي أنها تخطط لزيادة أسعار الاشتراك لبعض عملاء الأعمال لتعكس “تجربة المنتج الموسعة” والقيمة التي أضافتها أدوات الذكاء الاصطناعي التوليدية إلى النظام الأساسي.

من المحتمل أن يكون شراء Leonardo.AI مدرجًا في خطتها الاستثمارية، ولكن قد يشعر المستخدمون بخيبة أمل لأنهم يدفعون تكاليف متزايدة مقابل التحسينات الإضافية بدلاً من قدرات الذكاء الاصطناعي التوليدية الجديدة تمامًا.

مقالات قد تعجبك

واتساب ستسمح بحفظ جهات الاتصال ضمن التطبيق
كوالكوم تكشف رسمياً عن أحدث معالجاتها للهواتف المحمولة Snapdragon 8 Elite
لعبة Spider-Man 2 ستتوافر على الكمبيوتر الشخصي بداية العام القادم
كيفية إيقاف تشغيل اهتزاز وصوت لوحة المفاتيح على أندرويد
هل تمثّل الأجهزة القديمة خطر حدوث حريق؟