إنفيديا تستعرض أحدث تقنيات رفع الجودة بالذكاء الاصطناعي

قامت شركة إنفيديا باستعراض تقنية جديدة يمكن استخدامها في رفع جودة فيديوهات يوتيوب المنخفضة باستخدام الذكاء الاصطناعي، وذلك ضمن إطار معرض CES 2023. ذلك نقلًا عن The Verge.

تلك التقنية، والتي تُعرف باسم RTX Video Super Resolution، صممت لرفع جودة الفيديوهات من خلال متصفح جوجل كروم أو مايكروسوفت إيدج حتى 4K، لكن سيتوجب عليك الحصول على معالج رسومي من فئة 3000 أو 4000 لاستخدام هذه التقنية.

شاركت إنفيديا مقطعًا تستعرض فيه تقنيتها الجديدة على مقطع للعبة Apex Legends، حيث يمكن أن نرى الحواف أصبحت أحد وتقليل العيوب الناتجة عن قلة الجودة. يمكن الاستنتاج أن تقنية RTX Video Super Resolution تعمل علي يوتيوب، لكن نشرت الشركة بيانًا مفاده أن التقنية الجديدة ستعمل “مع أي فيديو يتم عرضه عبر متصفح الويب.”

وفقًا لـ PCGamer، فإن التقنية الجديدة ستدعم الفيديوهات بدقة 360p إلى 1440p حتى 144 إطارًا في الثانية.

جدير بالذكر أن إنفيديا قامت بإضافة تقنية رفع جودة الفيديوهات بالذكاء الاصطناعي لأجهزة Shield TV وShield TV Pro، لكن إضافتها لمتصفحات الويب سيتيح استخدامها لشريحة أكبر من المستخدمين.

جوجل تعمل على أداة لقراءة وصفات الأطباء

أعلنت شركة جوجل عن عملها على أداة تمكن المستخدمون من قراءة وصفات الأطباء، والتي دائمًا ما تُكتب بخط يصعب قراءته حتى على الصيادلة أنفسهم. ذلك نقلًا عن The Verge.

جاء ذلك الإعلان ضمن مؤتمر جوجل السنوي الذي يُقعد في الهند، حيث أعلنت، وفقًا لـ TechCrunch، عن تعاونها مع مجموعة من الصيادلة لإنشاء أداة بالذكاء الاصطناعي قادرة على تفسير خط الأطباء.

لم تعلن الشركة عن موعد طرح تلك الأداة، كما لم تحدد ما إذا كانت الأداة ستكون مستقلة أو ملحقة مع إحدى تطبيقات جوجل.

فيما يلي مقتطف من مدونة جوجل الهند حول الخاصية الجديدة:

أعلنا اليوم عن نموذج حديث للذكاء الاصطناعي وتعلم الآلة يمكنه التعرف على الأدوية وحتى إبرازها ضمن الوصفات الطبية المكتوبة بخط اليد. سيكون هذا بمثابة تقنية مساعدة لرقمنة المستندات الطبية المكتوبة بخط اليد من خلال زيادة عدد الأشخاص الموجودين في الحلقة مثل الصيادلة، ولكن لن يتم اتخاذ أي قرار بناءً على المخرجات التي توفرها هذه التقنية فقط.

بينما يكون هذا النظام قيد التطوير حاليًا، فإننا نتطلع إلى مشاركة المزيد من التحديثات حول طرحه على نطاق أوسع.

قدمت جوجل بالفعل تقنية مشابهة من خلال Google Lens، وهي أداة التعرف على الأشياء متعددة الأغراض باستخدام الذكار الاصطناعي، والتي يمكن استخدامها للتعرف على الأشياء (مثل المنتجات أو النباتات أو أنواع الحيوانات) وترجمة اللغات. يمكن بالفعل استخدام تطبيق Google Lens لنسخ الملاحظات المكتوبة بخط اليد رقميًا، ومع ذلك، فإنها تعتمد على مدى وضوح الخط.

شركة ميتا تختبر ميزات التحقق من العمر في خدمة Facebook Dating

بدأت شركة ميتا في اختبار إمكانية التعرف على العمر من خلال أداة تعتمد على الذكاء الاصطناعي، والتي يمكن لمستخدمي خدمة المواعدة من فيسبوك، Facebook Dating، استخدامها للتحقق من العمر الحقيقي للمستخدمين. ذلك نقلًا عن The Verge.

أعلنت الشركة عبر مدونتها أنها ستبدأ في إخطار مستخدمي Facebook Dating بأن عليهم توثيق ما إذا كانوا أكبر من سن 18 عامًا، وذلك إذا شعرت المنصة بأن المستخدم قد يكون قاصرًا. سوف تتم عملية التوثيق من خلال رفع صورة للهوية الشخصية أو تسجيل مقطع فيديو، تلك المستندات سيتم تحويلها لشركة خارجية تُعرف بـ Yoti، والتي ستعتمد شركة ميتا على تقنياتها في تحليل العمر من خلال تلك المستندات.

تقول الشركة أن نظام التوثيق الجديد سيساعد على منع الأطفال والقصر بشكل عام من استخدام الميزات المخصصة للبالغين، خصوصًا وأنه لا توجد أي نوع من المطالبات للتحقق من سن البالغين “على سبيل المثال أولئك الذين يدعون أنهم 18 عامًا وأعمارهم تتعدى الأربعين.”

ليست تلك المرة الأولى التي اعتمدت فيها شركة ميتا على Yoti، حيث استخدمت أنظمة الشركة للتحقق من أولئك الذين قاموا بتغيير تواريخ ميلادهم ليبدوا أكبر.

تقول Yoti أن نظام التعرف على العمر الخاص بها دقيق للغاية؛ حيث، وفقًا لتصريحاتها، بلغ معدل تحديد الأشخاص الذين تتراوح أعمارهم بين  13 و17 عامًا بشكل صحيح والذين تقل أعمارهم عن 23 عامًا هو 99.65%. كما تقول تقول شركة ميتا إن نظام التحقق من العمر قد قام بفرز “مئات الآلاف” من الأشخاص في إصدارات مناسبة للعمر من التطبيق وأن 81% من المستخدمين الذين طلب منهم إنتسجرام التحقق من أعمارهم يختارون التحقق عبر Yoti.

بالرغم من ذلك، فإن نظام Yoti ليس دقيقًا كفاية، خصوصًا وأن بيانات النظام كشفت أنه سيء في التعرف على أوجه النسوة وذوي البشرة السمراء. 

جدير بالذكر أن الباحثون في مجال الذكاء الاصطناعي قد أعربوا عن مخاوفهم بشأن كيفية أداء برامج التعرف على الوجه والتحليل بشكل مختلف للأشخاص على أساس العمر، العرق، والجنس.

إنفيديا تتعاون مع مايكروسوفت لتطوير حواسيب الذكاء الاصطناعي الخارقة

أعلنت شركة إنفيديا عن “تعاون متعددة سنوات” مع شركة مايكروسوفت لبناء ما سمته “أقوى حواسيب الذكاء الاصطناعي الخارقة في العالم،” والتي تهدف إلى معالجة عمليات الحوسبة الضخمة لتدريب الذكاء الاصطناعي. ذلك نقلًا عن The Verge.

سيشهد التعاون استخدام إنفيديا لمثيلات الأجهزة الافتراضية القابلة للتطوير من مايكروسوفت لتسريع التقدم في نماذج الذكاء الاصطناعي التوليدية مثل DALL-E.

استنادًا إلى البنية التحتية السحابية Azure من مايكروسوفت، سيستخدم حاسوب الذكاء الاصطناعي الخارق عشرات الآلاف من وحدات معالجة الرسومات القوية H100 وA100 المصممة لمركز البيانات من إنفيديا ومنصة الشبكة Quantum-2 InfiniBand.

وفقًا لإنفيديا، فإن الجمع بين منصة Azure ووحدات معالجة الرسومات والشبكات ومجموعة الذكاء الاصطناعي الكاملة من إنفيديا سيسمح لمزيد من المؤسسات بتدريب ونشر وتوسيع نطاق الذكاء الاصطناعي، بما في ذلك النماذج الكبيرة والحديثة. ستعمل الشركتان أيضًا على تطوير DeepSpeed، وهو برنامج تحسين التعلم العميق من مايكروسوفت.

صرحت الشركة في بيان لها أنه يمكن استخدام الحاسوب الخارق في “البحث وزيادة تسريع التقدم في الذكاء الاصطناعي التوليدي،” فئة جديدة نسبيًا من نماذج اللغات الكبيرة مثل DALL-E وStable Diffusion التي تستخدم خوارزميات التعلم الذاتي لإنشاء مجموعة متنوعة من المحتوى، مثل النصوص، الأكواد، الصور الرقمية، الفيديوهات، والصوتيات. شهدت نماذج الذكاء الاصطناعي هذه نموًا سريعًا في السنوات الأخيرة مما أدى إلى زيادة الطلب بشكل كبير على أقوى أنظمة الحوسبة القادرة على التوسع جنبًا إلى جنب مع تطورها.

قال السيد مانوفير داس، نائب رئيس قسم حوسبة الشركات لدى إنفيديا ” إن تسارع تقدم تكنولوجيا الذكاء الاصطناعي وكذلك اعتماد الصناعة. أدى الاختراق في نماذج الأساس إلى موجة مد وجزر من البحث، تعزيز الشركات الناشئة الجديدة، وتمكين تطبيقات مؤسسية جديدة. سيوفر تعاوننا مع مايكروسوفت للباحثين والشركات أحدث بنية تحتية للذكاء الاصطناعي وبرمجيات للاستفادة من القوة التحويلية للذكاء الاصطناعي.”

اقرأ أيضًا: منصة GitHub تختبر إمكانية كتابة الأكواد عن طريق الصوت

شركة Canva تطرح خاصية لتوليد الصور عن طريق النصوص

قامت شركة Canva بطرح خاصية جديدة لتوليد الصور عن طريق الوصف النصي، والتي بدأت الشركة باختبارها في سبتمبر، والآن، بدأت تصل لأكثر من 100 مليون مستخدم. ذلك نقلًا عن The Verge.

تعتمد خاصية توليد الصور من Canva على نموذج Stable Diffusion مفتوح المصدر، مع بعض التعديلات البسيطة على الواجهة وإضافة الفلترة الأمنية “لمنع العبارات العنصرية أو الجنسية إلخ.” لتقديم أفضل تجربة ممكنة. كما ستكون تلك الخاصية متاحة بشكل مجاني عبر التطبيق بالإضافة إلى مزيد من الخصائص يمكن الحصول عليها، مثل إنشاء 100 صورة يوميًا، من خلال النسخة المدفوعة.

استخدام الخاصية سهل للغاية، قم بتشغيل خاصية توليد الصور عن الطريق الوصف النصي واكتب الوصف الذي تريده، ليكن مثلًا “رسمة بالألوان المائية لسمكة كوي تسبح في الماء،” كما يمكنك تحديد نوع الصورة سواء أكانت رسمة، صورة فوتوغرافية، ثلاثية الأبعاد، إلخ. كما يوجد أيضًا خيار الإبلاغ عن الصور المخالفة للمعايير التي تتضمن أمورًا مثل العنف، العنصرية، إلخ.

في حوار مع موقع The Verge، صرح السيد كاميرون آدمز، الشريك المؤسس لشركة Canva ومدير الإنتاج التنفيذي، قائلًا “نحن نتعامل مع هذا الأمر على أنه تجربة تعليمية إلى حد كبير لمجتمعنا. نحن حريصون على تضمين هذه التقنية باعتبارها مجالًا ناشئًا، والطريقة الدقيقة التي تعمل بها وكيفية تفاعل العملاء معها لا تزال قيد التطوير.”

هذه الميزة ليست سوى أحدث مثال على توافر أدوات الذكاء الاصطناعي لتوليد صور عن طريق النصوص بشكل كبير للعامة. حيث أدى إطلاق Stable Diffusion على وجه الخصوص إلى تسريع الوصول إلى هذه الأدوات، وكونه مفتوح المصدر، أتاح الفرصة لكثير من الشركات تضمينه في منتجاتها بشكل مجاني.

أثار ظهور هذه الأنظمة أيضًا بعض الجدل، لا سيما استخدامها للصور المحمية بحقوق الطبع والنشر لبيانات التدريب. اكتشف العديد من الفنانين أنه تم استخدام أعمالهم دون موافقتهم لإنشاء هذه المنتجات التجارية، على الرغم من تصريح الشركات والباحثين أن استخدام هذه البيانات مشمول بأحكام مثل الاستخدام العادل في الولايات المتحدة.

أثناء حواره مع The Verge، تحدث السيد آدمز عن الحيثيات القضائية لتلك التقنية قائلًا “أعتقد أن هناك العديد من الأسئلة المشروعة حول المدى الذي يمكن فيه اعتبار منتجات الذكاء الاصطناعي ضمن نطاق الاستخدام العادل، وسيختلف ذلك في جميع أنحاء العالم. على الرغم من عدم وضوح تلك المسألة، إلا أننا نراقبها عن كثب كوننا نملك علاقات جيدة مع مجتمع المساهمين والمستخدمين حتى نتمكن من معرفة الأسئلة المتعلقة بحقوق النشر. نحن نمنح ملكية الصور للمستخدمين، لكننا لا ندعي أنه يمكن لهؤلاء المستخدمين حماية حقوق الطبع والنشر لهم.

تقنيات ستجعلك لا تصدق أي شيء على الإنترنت

لطالما امتلأ الإنترنت بالمعلومات الخاطئة، ولكن على الأقل لم يكن من الصعب فصل الحقيقة عن الخيال بقليل من الجهد. أدى ظهور أدوات الذكاء الاصطناعي المتطورة إلى تغيير هذا الشيء إلى الأبد، مما جعل الشك أكثر أهمية من أي وقت مضى.

التزييف العميق:

تتضمن كلمة التزييف العميق deepfake مجموعة كاملة من التقنيات التي تشترك جميعها في استخدام الشبكات العصبية (العصبونية) للتعلم العميق لتحقيق أهداف فردية.

أصبح التزييف العميق deepfake اهتماماً عاماً عندما أصبح استبدال وجه شخص ما في مقطع فيديو أمراً سهلاً. لذلك يمكن لشخص ما أن يكون ممثلاً مع وجه رئيس الولايات المتحدة أو يستبدل فم الرئيس وحده ويجعله يقول أشياء لم يقلها قط.

لفترة من الوقت، كان يتعين على الشخص التدرب على انتحال الصوت، لكن تقنية التزييف العميق deepfake يمكنها أيضاً تزييف الأصوات.

يمكن الآن استخدام تقنية التزييف العميق deepfake في الوقت الفعلي، مما يفتح إمكانية قيام الأشخاص السيئين بانتحال شخصية شخص ما في مكالمة فيديو أو بث مباشر في الوقت الفعلي.

يجب التعامل مع أي دليل تراه على الإنترنت بشكل فيديو على أنه مزيف محتمل حتى يتم التحقق منه.

توليد الصور بالذكاء الاصطناعي:

تسببت مولدات الصور التي تعمل بالذكاء الاصطناعي في إثارة ضجة في مجتمع الفنانين بسبب جميع الآثار المترتبة على أولئك الذين يكسبون عيشهم كفنانين وما إذا كان الفنانون معرضون لخطر الاستبدال!

المشكلة الأكبر هي احتمال وجود معلومات مضللة بفضل هذه التقنية.

يمكن أن تنتج أنظمة توليد الصور بالذكاء الاصطناعي صوراً واقعية باستخدام مطالبات تستند إلى النص، أو إلى الصور، بغرض التلاعب.

على سبيل المثال، يمكنك مسح أجزاء معينة من الصورة الأصلية ثم استخدام تقنية تُعرف باسم الرسم الداخلي Inpainting لجعل الذكاء الاصطناعي يستبدل الجزء الممسوح من الصورة بأي شيء تريده.

من السهل إنشاء صور على جهاز الكمبيوتر باستخدام برنامج مثل Stable Diffusion أو توليد صور باستخدام الذكاء الاصطناعي بواسطة Midjourney.

إذا أردت أن تجعل الأمر يبدو وكأن شخصاً ما كان يحمل مسدساً حقيقياً بدلاً من لعبة، فهذا أمر تافه بالنسبة للذكاء الاصطناعي.

توليد الفيديو بالذكاء الاصطناعي:

إنشاء صور الذكاء الاصطناعي والتزييف العميق هي مجرد البداية. عرضت Meta (الشركة الأم لموقع فيس بوك Facebook) بالفعل إنشاء فيديو باستخدام الذكاء الاصطناعي AI، وعلى الرغم من أنه يمكن إنشاء بضع ثوانٍ فقط في كل مرة، فإننا نتوقع أن يتوسع طول الفيديو ومقدار التحكم الذي سيحظى به المستخدمون أضعافاً مضاعفة.

لطالما كان من السهل معالجة الفيديو قبل أن يصبح إنشاء الفيديو بالذكاء الاصطناعي ممكناً. ومع ذلك، لا يمكنك الآن الوثوق بأي فيديو تراه على الإطلاق.

الرد التلقائي بالذكاء الاصطناعي AI Chat Bots:

عندما تدخل في محادثة مع دعم العملاء، فأنت تتحدث إلى آلة وليس إلى إنسان. تعد تقنية الذكاء الاصطناعي (وطرق البرمجة التقليدية) جيدة بما يكفي لإجراء محادثات معقدة، خاصة إذا كانت في نطاق ضيق مثل الحصول على بديل الضمان أو إذا كان لديك سؤال تقني حول شيء ما.

يعد التعرف على الصوت أيضاً في حالة متقدمة. بمجرد إطلاق الروبوتات التي تعمل بالذكاء الاصطناعي على منصات وسائل التواصل الاجتماعي، تصبح احتمالية حملات التضليل المنسقة ذات العواقب الواقعية عالية.

لكي نكون منصفين، لطالما واجهت منصات الوسائط الاجتماعية مثل تويتر Twitter مشكلة مع بوتات الرد التلقائي، ولكن بشكل عام كانت هذه الروبوتات غير متطورة.

يمكنك إنشاء شخص مختلق على وسائل التواصل الاجتماعي يخدع أي شخص تقريباً. يمكن حتى استخدام التقنيات الأخرى التي ذكرناها في هذه المقالة لإنشاء الصور والصوت والفيديو لإثبات أن كل شيء حقيقي.

كتّاب الذكاء الاصطناعي:

نذهب إلى الإنترنت للحصول على معلومات للتعرف على العالم ومعرفة ما يجري حوله. يعتبر الكتاب البشريون (أي نحن!) مصدراً رئيسياً لتلك المعلومات، لكن كتّاب الذكاء الاصطناعي أصبحوا جيدين بما يكفي لتقديم أعمال ذات جودة مماثلة.

تماماً كما هو الحال مع فناني الذكاء الاصطناعي، هناك جدل حول ما إذا كانت هذه البرامج ستحل محل الأشخاص الذين يكتبون لكسب لقمة العيش.

إذا كان بإمكانك إنشاء وجه حقيقي، وإنشاء بوت شخصي لوسائل التواصل الاجتماعي، وإنشاء فيديو وصوت يبرزان شخصك المختلق، يصبح من الممكن استحضار منشور كامل بين عشية وضحاها.

تعد مواقع الأخبار المشكوك فيها مصدراً لمعلومات مضللة مقنعة للعديد من مستخدمي الإنترنت، ولكن تكنولوجيا الذكاء الاصطناعي مثل هذه يمكن أن تزيد من حدة هذه المشكلة.

مشكلة كشف التزييف:

هذه التقنيات ليست مشكلة فقط لأنها تفتح طرقاً جديدة لسوء الاستخدام، بل إنها أيضاً مشكلة لأن اكتشاف التزييف قد يكون صعباً.

لقد وصل التزييف العميق بالفعل إلى النقطة التي يجد فيها الخبراء صعوبة في تقرير ما هو مزيف وما هو ليس كذلك.

هذا هو السبب في أنهم يكافحون النار بالنار ويستخدمون تقنية الذكاء الاصطناعي لاكتشاف الصور التي تم إنشاؤها أو التلاعب بها، من خلال البحث عن علامات فارقة غير مرئية للعين البشرية.

سيعمل هذا لفترة من الوقت، ولكنه قد يؤدي أيضاً إلى إنشاء سباق تسلح غير مقصود للذكاء الاصطناعي والذي قد يدفع بشكل مثير للسخرية التقنيات التي تنشئ محتوى مزيفاً إلى مستويات أعلى من الدقة.

الإستراتيجية الوحيدة العاقلة بالنسبة لنا كبشر هي افتراض أن أي شيء نراه على الإنترنت يجب التعامل معه على أنه مزيف حتى يثبت العكس، ما لم يكن من مصدر تم التحقق منه.

كيفية إنشاء صورة في Midjourney باستخدام الذكاء الاصطناعي

ازدادت شعبية مواقع وتطبيقات توليد الصور القائمة على الذكاء الاصطناعي مثل DALL-E 2. تعد Midjourney واحدة من أكثر الأدوات تقدماً، ويمكنك تجربتها الآن.

ما هو Midjourney؟

قبل أن نتحدث عن Midjourney، فلنبدأ بـ DALL-E 2، الذي ربما سمعت عنه. يقع DALL-E 2 في نهاية أدوات إنشاء الصور القائمة على الذكاء الاصطناعي.

يمكنه إنشاء صور جديدة تماماً من مطالبة نصية بسيطة. يمكنك إدخال “روبوت يأكل تاكو”، وسيقوم الموقع بإنشاء صورة تصور روبوتاً يأكل تاكو.

لنأخذ مثلاً Craiyon، المعروف سابقاً باسم DALL-E mini. إنها أداة ويب مجانية يمكن لأي شخص استخدامها، ولكنها ليست معقدة مثل DALL-E 2. غالباً ما تكون النتائج غريبة ومخيفة إلى حد ما، ولكن لا يزال اللعب بها ممتعاً للغاية.

يقع Midjourney في مكان ما بين DALL-E 2 و Craiyon. كما أنه يستخدم الذكاء الاصطناعي والتعلم الآلي لإنشاء الصور بناءً على الأوامر النصية.

عادةً ما تكون النتائج جيدة جداً، ولكنها ليست مذهلة مثل DALL-E 2. الشيء المهم هو أنه يمكن لأي شخص تجربة الإصدار التجريبي من Midjourney في الوقت الحالي (اعتباراً من آب 2022) على عكس DALL-E 2. لا توجد فترة انتظار مطلوبة.

كيفية استخدام Midjourney Beta:

الشيء الوحيد الذي تحتاجه لاستخدام Midjourney Beta هو حساب Discord. إنه المكان الذي ستقدم فيه مطالبات نصية إلى الروبوت Midjourney.

يمكنك التسجيل للحصول على حساب مجاني على موقع Discord الإلكتروني. بعد ذلك، يمكنك استخدام Discord في متصفح الويب أو تنزيل التطبيق لأنظمة ويندوز Windows وماك Mac و لينكس Linux و أندرويد Android وآيفون iPhone.

بمجرد الانتهاء من إعداد Discord، انتقل إلى موقع Midjourney على الويب واختر Join the Beta.

سينقلك هذا إلى Discord، حيث يمكننا تحديد Accept Invite.

هناك شيئان يجب معرفتهما حول الإصدار التجريبي. تبدأ بإصدار تجريبي مجاني يتضمن حوالي 25 مطالبة نصية مجانية. بعد ذلك، يمكنك شراء عضوية كاملة إذا كنت ترغب في ذلك.

للبدء، انتقل إلى إحدى قنوات Newcomer Rooms في الشريط الجانبي. سنستخدم #newbies-42 ولكن هناك عدداً آخر من الخيارات.

في مربع النص، أدخل التعليمة /imagine ثم اكتب النص الذي تريده وقم بتأكيده.

يمكنك مشاهدة تقدم العمل أثناء إنشاء الصور الأربع.

عند الانتهاء من الصور، سيتم عرضها في رسالة جديدة. الآن لديك بعض الخيارات الإضافية.

  • U=Upscale: لإنشاء نسخة أكبر من الصورة.
  • V=Variation: ينشئ صورة جديدة بناءً على الصورة التي حددتها.
  • ستحصل على أربع صور جديدة لنفس الطلب.

ستصل النتائج في رسالة جديدة، وسيكون لديك بعض الخيارات الجديدة لإجراء المزيد من الأشكال أو الارتقاء بها إلى أقصى الحدود.

إذا كنت تريد حفظ الصور في أي وقت، فما عليك سوى تحديد الصورة والنقر على رمز التنزيل على الهاتف المحمول أو Open Original على سطح المكتب لمشاهدة الصورة بالحجم الكامل المطلوب حفظها.

هذا إلى حد كبير كل ما في Midjourney Beta! ببساطة اكتب /imagine ويمكنك أن تتبعه بأمر نصي من اختيارك.

ضع في اعتبارك أن بعض الكلمات غير مسموح بها، لكنها في الغالب لعبة عادلة، ويمكنك أن ترى ما يصنعه الآخرون. هناك ذكاء اصطناعي مجنون جداً هذه الأيام، استمتع!

أفضل تطبيقات توليد الصور باستخدام الذكاء الاصطناعي

تطبيقات توليد الصور بالذكاء الاصطناعي مثل DALL-E 2 و Midjourney انفجرت فجأة. يبدو أن المزيد من هذه الأدوات تظهر طوال الوقت، لكنها ليست متاحة دائماً للجمهور. إليك ما يمكنك استخدامه الآن.

Midjourney Beta:

يحقق Midjourney توازناً جيداً بين سهولة الاستخدام والنتائج الرائعة. كل ما تحتاجه لاستخدامه هو حساب Discord.

يتم إرسال التعليمات النصية كرسائل في قناة، وستتمكن من رؤية ما يقوم الآخرون بإنشائه أيضاً. تقدم Midjourney بعض الميزات الإضافية الرائعة مثل تكبير الصور.

يمكن استخدام MidJourney Beta مجاناً لأول 25 أمر (تعليمة نصية). بعد ذلك، يمكنك الاختيار من بين عدد من الخطط التي تبدأ من 10 دولارات شهرياً.

Stable Diffusion:

Stable Diffusion هو منشئ صور تعلم آلي مفتوح المصدر. يمكنه إنشاء صور من المطالبات النصية مثل العديد من الأدوات الأخرى، بالإضافة إلى تعديل الصور الحالية والصور الباهتة. يعمل Stable Diffusion محلياً على جهاز الكمبيوتر.

الشيء الرائع في Stable Diffusion هو أنه مجاني تماماً، وتحظى بقدر كبير من التحكم نظراً لأنه يعمل محلياً. ستحتاج إلى التأكد من أن جهاز الكمبيوتر يفي بالمتطلبات.

إذا لم يكن لديك القدرة لتشغيله على نظامك، فيمكنك أيضاً تجربته على الويب. هناك أيضاً مواقع ويب أخرى تستضيف Stable Diffusion عبر الإنترنت.

يمكنك أيضاً عرض معرض صور قابل للبحث تم إنشاؤه بواسطة Stable Diffusion عبر الإنترنت، يشبه استخدام Stable Diffusion ولكن دون انتظار إنشاء كل صورة.

Craiyon (DALL-E Mini):

ارتفعت شعبية DALL-E Mini بعد أن بدأت DALL-E 2 في الظهور. تم تغيير اسمها لاحقاً إلى Craiyon لتجنب الالتباس.

Craiyon هي أداة ويب، وهي ليست مثيرة للإعجاب مثل غيرها في القائمة. ومع ذلك، فمن السهل جداً استخدامها بدون حسابات أو أي شيء آخر.

ما عليك سوى إدخال مطالبة نصية والسماح لها بالقيام بالعمل.

NightCafe:

NightCafe هي أداة ويب تنشئ صوراً من مطالبات نصية في أنماط فنية محددة. على سبيل المثال، يمكنك اختيار أنماط مثل الرسم الزيتي أو التكعيبي أو الخيال أو الألعاب ثلاثية الأبعاد.

يتضمن NightCafe أيضاً القدرة على إنشاء مقاطع فيديو.

أنت مقيد بخمس أوامر مجانية كل يوم، ويمكن أن تكون العملية بطيئة بعض الشيء بسبب حركة المرور الكثيفة. لإنشاء أكثر من ذلك، ستحتاج إلى شراء خطة إضافية تبدأ من 7.99 دولاراً.

Dream by Wombo:

Dream by Wombo هو تطبيق مشابه لـ NightCafe. يتم إقران المطالبات النصية بأنماط فنية، مثل المضلع و الواقعي و meme و الخط الفني.

ومع ذلك، لديك خيار اختيار بلا نمط إذا كنت ترغب في ذلك. يتم الوصول إلى Dream على الويب، وهناك إصدار للجوال أيضاً. Dream مجاني تماماً للاستخدام ولا توجد قيود يومية.

DALL-E 2:

من المحتمل أن يكون DALL-E 2 هو منشئ صور الذكاء الاصطناعي الذي سمعت عنه أولاً. يعتبر الكثيرون أنه أفضل الأدوات، على الرغم من أن المنافسة تزداد بسرعة من أقرانه. يتمتع DALL-E 2 بواجهة سهلة الاستخدام وسوف ينتج لك بعض الإبداعات المذهلة.

لم يكن متاحاً للجمهور لفترة من الوقت، ولكن اعتباراً من أيلول 2022، يمكن لأي شخص الاشتراك بدون انتظار. يحصل كل مستخدم على 50 أمر كرصيد مجاني في الشهر الأول، ثم 15 مرة كل شهر بعد ذلك. كما يمكنك شراء المزيد.

كما ترى، يمكن الوصول إلى بعض مولدات صور الذكاء الاصطناعي هذه أكثر من غيرها. هناك الكثير من هذه الأدوات المتاحة، وسيظهر المزيد بسرعة.

إذا كنت تبحث فقط عن اختبار هذا الشيء وبعض المرح، فستبدأ مع هذه الخيارات.

إيلون ماسك يستعرض نموذج أولي للروبوت “أوبتيموس”

قام السيد إيلون ماسك، المدير التنفيذي لشركة تيسلا، باستعراض نموذج أولي للروبوت “أوبتيموس” الذي يملك بعض برمجيات الذكاء الاصطناعي والمستشعرات المقتبسة من سيارات الشركة. ذلك نقلًا عن The Verge.

اعترف السيد ماسك في بداية مؤتمر Tesla 2022 AI Day أن لديهم “روبوت” يعملون عليه العام الماضي، ولكنه وعد بشيء أكثر إثارة اليوم.

وفقًا لإيلون ماسك، فإن بإمكان النموذج الأولي القيام بأشياء أكثر من التي شوهدت في العرض الحي، لكن “المرة الأولى التي يعمل بها دون وصلات كانت على المسرح الليلة.” كما توقع السيد ماسك بأن سعر الروبوت لن يزيد عن 20 ألف دولار، كما وضح لاحقًا في جلسة للأسئلة أن الشركة جيدة في إنشاء الذكاء الاصطناعي والمشغلات اللازمة للروبوتات بناءً على خبرتها في تصنيع وحدات القيادة لسياراتها الإلكترونية.

يدّعي إيلون ماسك أن الفرق بين تصميم تيسلا وبين ما سماه بـ “استعراضات الروبوتات المثيرة للاهتمام” أن أوبتيموس صُمم للإنتاج الكمي، حيث من المخطط إنتاج ملايين الوحدات منه.

في البداية، فتحت الأبواب الخلفية للمسرح للكشف عن نسخة مفككة من أوبيموس تعرف باسم “Bumble C” الذي سار إلى الأمام وقام برقصة Raise the Roof. اعترف ماسك بأنهم أرادوا الحفاظ على سلامته، وعدم القيام بالكثير من الحركات على خشبة المسرح تجعله يسقط على وجهه.

بعدها، قامت الشركة بمشاركة بعض مقاطع الفيديو تُظهر الروبوت يقوم بأداء بعض المهام مثل حمل الصناديق. ثم أحضر فريق تيسلا نموذج آخر يظهر “النسخة الأقرب للإنتاج” من أوبتيموس والذي يأتي مجمعًا بالكامل، ولكنه لا يعمل بكامل طاقته، حيث تم تثبيته وقام بالتلويح للجمهور، مستعرضًا كم الحركات المعصم واليد التي يقدمها. ادعى ماسك أن هذه لا تزال تحتوي على مشغلات، حزمة بطارية، وكل شيء آخر، لكنها “لم تكن جاهزة تمامًا للسير.”

كشفت الشركة أن الروبوت الأولي المقدم تم تطويره في الأشهر الستة الماضية فقط. عند مناقشة العقبات التي يتعين عليهم معالجتها في الانتقال من النموذج الأولي إلى التصميم العملي، فإنهم يأملون “إنجاز ذلك في غضون الأشهر أو السنوات القليلة المقبلة.”

يحتوي الروبوت على بطارية بقوة 2.3 كيلو وات في الساعة، وتعمل بشريحة Tesla SoC، ولديه اتصال Wi-Fi وشبكات LTE. ركز الاستعراض على معالجة مفاصل الروبوت، مثل اليدين، الرسغ، والركبتين، وأظهرت كيف قاموا بمعالجة البيانات لكل مفصل، ثم بحثوا عن المناطق المشتركة في كل تصميم للعثور على طريقة باستخدام ست مشغلات مختلفة فقط. يقول المهندسون عن الأيدي الشبيهة بالبشر هي “تصميم مستوحى من الناحية البيولوجية” إنها ستجعلها أكثر ملاءمة لالتقاط أشياء من مختلف الأشكال والأحجام، و”قبضة محكمة” على الأجزاء الصغيرة.

تم إضافة برنامج القيادة الآلية من سيارات تيسلا إلى الروبوت الجديد، وتم إعادة صياغتها لتتوافق مع الجسم والبيئة الجديدة، حيث قامت الشركة بالتقاط حركات أشخاص يقومون بمهام حقيقية مثل رفع صندوق ثم استخدام الحركية العكسية، وتكرر الحركات باستخدام أوبتيموس. ثم يتم تطبيق “التكيف مع الحركة المتصل Online Motion Adaptation” لجعل هذه الماهم غير مقيدة ويمكن تغييرها لموائمة البيئة غير المنظمة.

صرح السيد إيلون ماسك قائلًا “سيكون تحولًا أساسيًا للحضارة كما نعرفها.” ويواصل القول إن أوبتيموس لديه القدرة على “القيام بضعفي الأداء” لتحسين محتمل للناتج الاقتصادي.

أعلن ماسك لأول مرة عن ذلك الروبوت في مؤتمر Tesla AI Day للعام الماضي، ووعد بأنه سيكون “ودودًا” ويحتمل أن يحدث ثورة في خط تجميع الشركة وأعمال التصنيع.

كان ماسك قد حذر معجبيه من ألا يتوقعوا أن يبدو النموذج الأولي مثل العرض الأولي للعام الماضي. لم تهدأ الحماسة حيث وصل ماسك الروبوت قائلًا “أهم عملية تطوير لمنتج نقوم به هذا العام” وتوقع أنه سيكون “أكثر أهمية من تجارة السيارات بمرور الوقت.”

يمكن أن نرى أوبتيموس في العديد من التطبيقات الحياتية مثل الطبخ، البستنة، وغيرها. كما يدعي إيلون ماسك أن الإنتاج قد يبدأ في أقرب وقت في العام المقبل.

في الأيام التي سبقت مؤتمر AI Day، حذر خبراء الروبوتات من الثقة في ادعاءات ماسك، حيث لاحظوا أن الشركات الأخرى تتقدم كثيرًا في تطوير الروبوتات التي يمكنها المشي والجري وحتى القفز، لكن لا أحد يدعي أنه قريب من استبدال العمالة البشرية.

إن تاريخ شركة تيسلا مليء بالأفكار الخيالية التي لم تنتهِ أبدًا، على سبيل المثال، شبكة Super Charger التي تعمل بالطاقة الشمسية، تبديل البطارية، أو روبوتات الشحن المصممة على هيئة ثعبان. لذلك، لا أحد يتوقع إذا كان روبوت تيسلا المعلن سيرى النور يوم ما. لكن الشركة وصلت إلى ما هي عليه اليوم بسبب إرادة إيلون ماسك المطلقة. ومن المؤكد أن الكشف عن نسخة أولية من الروبوت سيعزز مزاعم ماسك عن شركة تيسلا باعتبارها “أكبر شركة روبوتات في العالم.”

موقع DALL-E أصبح متاحًا للاستخدام الفوري

قامت شركة OpenAI بإلغاء قائمة الانتظار لاستخدام نظام DALL-E 2 لتحويل النص إلى صورة، مما يعني أنه بإمكان أي شخص تجربة هذه الأداة الآن وإنشاء صورًا باستخدام الذكاء الاصطناعي على الفور. ذلك نقلًا عن The Verge.

كشفت الشركة عن الإصدار الأول DALL-E في يناير 2021، حيث أثارت إعجاب كل من خبراء الذكاء الاصطناعي والجمهور بقدرتها على تحويل أي وصف نصي (أو موجه) إلى صورة فريدة. منذ ذلك الحين، تم إنشاء العديد من التطبيقات المشابهة تنافس سرعة وجودة DALL-E مثل Midjourney وStable Diffusion، والأهم، لا قوائم انتظار، الأمر الذي قد يؤثر على OpenAI بالسلب.

كانت شركة OpenAI، والتي تلقت تمويلًا كبيرًا من شركة مايكروسوفت، حذرة بشأن الإصدار العام لـ DALL-E. حيث لاحظ الخبراء أن أنظمة تحويل النص إلى صورة قادرة على إنتاج صور قد تتسبب في لإحداث مشاكل للبعض مثل إنشاء صور عارية أو إنشاء صور بغرض نشر معلومات مضللة وغير ذلك.

هناك أيضا قضايا التحيز، نظرًا لأن أنظمة تحويل النص إلى صور يتم تدريبها على مجموعات بيانات ضخمة من الصور المأخوذة من الإنترنت، فإنها تكرر جوانب غير متكافئة من المجتمع. على سبيل المثال، اطلب من نظام ما أن يرسم صورة لرئيس تنفيذي، وسينتج عادة صورة لرجل أبيض.

اتخذت OpenAI عددًا من الإجراءات لمكافحة هذه الآثار، بما في ذلك تصفية الصور الجنسية والعنيفة من عينات التدريب الخاصة بها ورفض إنشاء صور بناءً على مطالبات صريحة مماثلة. ومع ذلك، فقد تعرضت الشركة أيضًا لانتقادات بسبب ما يعتبره البعض نهجًا مفرطًا في فرض القيود.

علق السيد عماد موستاك، مؤسس AI Stable، بشأن ذلك الأمر أنها “خطوة حمقاء” من OpenAI لعدم إنشاء صور من كلمات مثل “أوكرانيا” و “أوديسا”. (يفترض أن هذه المصطلحات تخضع للرقابة بسبب قدرتها على خلق معلومات مضللة أثناء الحرب الجارية). وانتقد آخرون محاولات الشركة لإصلاح التحيز ووصفوها بأنها “اختراق”. على سبيل المثال، يقوم DALL-E بإدراج عبارات مثل “رجل أسود” و “امرأة آسيوية” بشكل غير ملحوظ في مطالبات المستخدم التي لا تحدد الجنس أو العرق من أجل دفع النظام بعيدًا عن توليد صور للأشخاص البيض. هذا يخفف التحيز في مخرجات DALL-E، لكن بعض المستخدمين لاحظوا أيضًا أنه ينشئ صورًا غير مرغوب فيها لا تتطابق مع تعليماتهم.

نشرت شركة OpenAI على مدونتها أنها راضية عن التحسينات التي أدخلتها على أنظمة السلامة الخاصة بها وأن هذا سيساعد في تعويض الأضرار المحتملة بحيث يصبح الوصول إلى DALL-E أكثر سهولة. قالت الشركة “في الأشهر الماضية، جعلنا عوامل الفلترة الخاصة بنا أكثر قوة في رفض محاولات إنشاء محتوى جنسي وعنيف ومحتوى آخر ينتهك سياسة المحتوى الخاصة بنا، وبناء تقنيات جديدة للكشف والاستجابة لوقف سوء الاستخدام.”

وقالت الشركة أيضًا إنها تختبر واجهة برمجية API لـ DALL-E تسمح للشركات بإنشاء تطبيقاتها ومكوناتها الإضافية باستخدام مخرجات النظام. هذا من شأنه أن يجعل من السهل على OpenAI تسويق مخرجات DALL-E، وربما الجمع بين النظام والأدوات المستخدمة من قبل الرسامين والمصممين، على سبيل المثال.

أي شخص يقوم بالتسجيل للوصول إلى DALL-E سيحصل على 50 رصيدًا مجانًا ثم 15 رصيدًا مجانيًا إضافيًا كل شهر بعد ذلك. يمكن استخدام كل رصيد لإنشاء صورة واحدة، أو شكل مختلف من صورة، أو ترميم صورة. يمكن شراء أرصدة إضافية في كتل من 115 مقابل 15$. تقول شركة OpenAI إن حوالي 1.5 مليون مستخدم DALL-E ينتجون أكثر من مليوني صورة كل يوم.