حتى أفضل المصورين قد يحصلون على لقطات ضبابية بشكل عرضي. لكن هواة التصوير المتواضعون قد يحصلون عليها طوال الوقت.
لحسن الحظ، يمكن لأداة الذكاء الاصطناعي الجديدة أن تجعل حتى الصور غير الواضحة المعالم تماماً إلى صور ذات جودة عالية؛ فهي بالفعل تقوم بعمل مثير للإعجاب.
تم تطوير الأداة من قبل باحثين في جامعة Duke كنهج جديد لتصحيح الصور، تعمل عن طريق البحث من خلال الصور التي يتم إنشاؤها بالذكاء الاصطناعي للوجوه عالية الدقة حتى يجد تلك التي تشبه الصورة المدخلة عند ضغطها بنفس الحجم.
يتم إنشاء الصور باستخدام شبكات توليدية متضادة تسمى generative adversarial networks أو اختصاراً (GANs)، التي تنتج صوراً جديدة عن طريق تحليل شبكتين عصبونيتين ضد بعضهما البعض.
واحدة منهما تولد صوراً جديدة وتتحقق الأخرى من الشكل؛ تصبح الشبكة الأولى أفضل بتدريبها عن طريق خوارزمية معينة حتى تعتقد الثانية أن الصورة يمكن أن تكون النتيجة الحقيقية.
يقول فريق الباحثين أنه يمكن تحويل عدد قليل من وحدات البكسل إلى وجوه واقعية بدقة تصل إلى 64 ضعف دقة الإدخال. يزعمون أنه يمكن حتى تخيل ملامح جديدة غير ظاهرة في الأصل، مثل التجاعيد والرموش وقصبة الرقبة.
كما يعتقدون أنه يمكن إنشاء صور لمجموعة من التطبيقات الأخرى، مثل الفحص المجهري وصور الأقمار الصناعية.
قالت عالمة الكمبيوتر في جامعة Duke ، Cynthia Rudin، التي قادت فريق البحث:
“لم يتم أبداً إنشاء صور فائقة الدقة من قبل بهذه التفاصيل الكبيرة”.
مثال توضيحي:
لقد قمنا بتجربة صورة لوجه، حيث قمنا في المرحلة الأولى بتشويهها قليلاً ثم إعادة الحصول عليها باستخدام الأداة، وإليك النتيجة (تمثل الصورة الأولى بعد السهم الثاني النتيجة، والثانية تمثل الصورة الأصلية لمقارنتها مع النتيجة):
نعتقد أن النتائج جيدة إلى حد ما، بالرغم من فقدان بعض الشعر، لكن بالتأكيد سترضينا هذه النتائج مقارنة بالصورة المشوّهة.
دعنا نرى كيف سيتم ذلك عندما نقوم بالتشويه بشكل كبير:
الآن قد تكون معجباً حقاً بالنتيجة. الصور قد لا تبدو متشابهة تماماً، لكنها بالتأكيد نتيجة مبهرة وهناك تشابه كبير.
يمكنك تجربة الأداة بنفسك من خلال الضغط على هذا الرابط، كما يمكنك زيارة موقع الفريق على الويب من خلال هذا الرابط.
يستخدم فيسبوك الذكاء الاصطناعي للكشف عن المحتالين والمزعجين على مسنجر Messenger وذلك دون أن يقوم بقراءة محادثاتك.
تستخدم هذه الميزة تعلُم الآلة للكشف عن النشاط المشكوك به، مثل قيام البالغين بإرسال الكثير من طلبات الصداقة أو الرسائل إلى الآخرين.
عندما يكتشف سلوكاً مشتبهاً به، يرسل تحذيراً داخل التطبيق إلى أعلى المحادثة، وهذا سيدفع المستخدمين إلى حظر الحسابات المشبوهة أو تجاهلها، ويقدم نصائح حول كيفية تجنب عمليات الاحتيال المحتملة.
تقول فيسبوك Facebook أن الميزة لا تحتاج إلى إلقاء نظرة على الرسائل نفسها. وبدلاً من ذلك، يبحث عن إشارات سلوكية مثل إرسال العديد من الطلبات في فترة زمنية قصيرة.
هذا يعني أنها ستعمل عندما يصبح مسنجر Messenger مشفراً من طرف إلى طرف، حيث قال رئيس خصوصية رسائل فيسبوك Jay Sullivan في بيان له:
“لقد قمنا بتصميم ميزة الأمان هذه للعمل مع التشفير الكامل. يجب أن يكون الأشخاص قادرين على التواصل بشكل آمن وخاص مع الأصدقاء والأحباء دون أن يستمع أي شخص إلى محادثاتهم أو يراقبها”.
اختارت فيسبوك Facebook عدم حظر الحسابات المشبوهة التي تشير إليها الميزة الجديدة تلقائياً. وبدلاً من ذلك، سيحث المستخدمين على اتخاذ قرارهم بنفسهم.
يشبه هذا النهج التنبيهات التي يرسلها فيسبوك Facebook الآن إلى المستخدمين الذين يتفاعلون مع المعلومات الخاطئة عن الفيروسات التاجية، والتي توجههم إلى صفحة ويب غير موثوقة.
قال ستيفن بلكام، الرئيس التنفيذي لمعهد أمان العائلة عبر الإنترنت، إنه وافق على الاستراتيجية:
“من المهم استخدام لغة تمكن الأشخاص من اتخاذ قرارات حكيمة والتفكير بشكل أكثر انتقاداً بشأن من يتفاعلون معه عبر الإنترنت. يسعدنا بشكل خاص أن نرى هذا ينعكس على النهج المدروس حول اعتبارات السلامة للمستخدمين الأصغر سنًا”.
بدأت فيسبوك Facebook في طرح الميزة الجديدة على أندرويد Android في شهر آذار وستضيفها إلى iOS الأسبوع المقبل.
تَعِد مايكروسوفت Microsoft بتحسين نظام ويندوز الفرعي لنظام التشغيل لينكس (WSL) بشكل كبير من خلال دعم تطبيقات لينكس ذات الواجهة وتسريع أجهزة معالجة الرسوميات.
يضيف عملاق البرامج نواة لينكس Linux كاملة إلى Windows 10 مع WSL الإصدار 2 في وقت لاحق من هذا الشهر، ويخطط الآن لدعم تطبيقات لينكس ذات الواجهة التي سيتم تشغيلها جنباً إلى جنب مع تطبيقات ويندوز Windows العادية.
سيتم تمكين هذا دون أن يضطر مستخدمو ويندوز Windows إلى استخدام إعادة التوجيه X11 ، وهو مصمم بشكل أساسي للمطورين لتشغيل بيئات التطوير المتكاملة (IDE) في لينكس Linux إلى جانب تطبيقات ويندوز Windows العادية.
على الرغم من أنه كان من الممكن تشغيل تطبيقات Linux GUI داخل ويندوز Windows سابقاً باستخدام خادم X تابع لجهة خارجية، إلا أن أداء الرسومات السيئ كان دائماً مشكلة.
تعد مايكروسوفت Microsoft بحل هذه المشكلة أيضاً. وسيحصل Windows 10 قريباً على دعم إضافي لتسريع أجهزة معالجة الرسومات GPU باستخدام أدوات لينكس Linux.
ويركز هذا في المقام الأول على سيناريوهات التطوير التي تُبنى على أساس الحساب المتوازي أو تدريب على التعلم الآلي ونماذج الذكاء الاصطناعي.
سيبدأ تسريع أجهزة معالجات الرسومات GPU في الظهور في الأشهر القليلة القادمة لـ Windows 10 Insiders في Fast Ring ، وتخطط مايكروسوفت Microsoft لمشاركة المزيد من المعلومات حول توقيت دعم تطبيق Linux GUI في وقت لاحق من هذا العام.
من الواضح أن جميع التحسينات الأخيرة التي تم إجراؤها على لينكس Linux تستهدف بشكل مباشر المطورين الذين يريدون استخدام ويندوز Windows كأداة تطوير.
أدخلت مايكروسوفت Microsoft بعض التحسينات القوية على ويندوز Windows مع WSL في السنوات الأخيرة بعد أن فاجأت الجميع بإضافة Bash shell إلى ويندوز Windows في Build قبل أربع سنوات.
أضافت مايكروسوفت Microsoft أيضاً OpenSSH الأصلي في Windows 10 ، وحتى Ubuntu و SUSE Linux و Fedora في متجر ويندوز Windows.
كما تم إطلاق أداة سطر أوامر Windows Terminal في مايكروسوفت Microsoft في العام الماضي، وقد وصلت الآن إلى الإصدار العام 1.0 هذا الأسبوع.
وتعمل مايكروسوفت Microsoft أيضاً على تحسين دعم ملفات لينكس Linux في مستكشف الملفات File Explorer لنظام التشغيل Windows 10.
نأمل أن يتناول WSL 2 ووعود تسريع معالج الرسومات GPU الجديدة هذه عدداً من مشكلات WSL المعلقة.
كانت مايكروسوفت Microsoft تكافح من أجل التوافق وأداء ملفات الإدخال/الإخراج في الإصدار الأصلي من WSL ، وقد كان مجالاً كبيراً للتركيز على WSL 2 الذي يصل إلى Windows 10 في وقت لاحق من هذا الشهر.
Google Lens هي أداة قوية بشكل لا يصدق بالفعل – ما عليك سوى توجيه الكاميرا إلى شيء مثير للاهتمام من حولك وستقدم لك نتائج البحث اعتماداً على ما تتعرف عليه.
كما أنها تجعل النص الذي تراه قابلاً للقراءة آلياً، مما يتيح لك الاتصال بأرقام الهاتف وحل المعادلات الرياضيات البسيطة.
يبدو أن جوجل Google تتطلع إلى توسيع الإمكانية الأخيرة، وذلك كما وجدت عمليات التدقيق التي أجراها المختصون والمهتمون من خلال تحليل كود APK. حيث قد تتمكن قريباً من توجيه هاتفك إلى معادلات الرياضيات والحصول على بعض المساعدة لحلها.
ظهر الدليل الأول للميزة في نهاية آذار في إصدار جوجل Google بيتا الإصدار 11.3 ، عندما ظهر الكود البرمجي الذي أظهر أن الشركة تستعد لوضع التعليم في التطبيق.
عند اختيار هذا الوضع، ستتمكن من توجيه الكاميرا إلى سؤال الواجب المنزلي للحصول على المساعدة. تشير المزيد من سلاسل الكود البرمجي إلى أن هذا سيساعدك في حل معادلات الرياضيات على وجه الخصوص.
يبدو أن جوجل Google الآن على وشك الانتهاء من هذه الميزة، كما هو موضح في أحدث إصدار تجريبي من قبل المطور مشعل رحمان حيث تمكن من تنشيط وضع التعليم ومسح معادلة بسيطة 5+5.
تسرد النتائج السؤال نفسه وتقدم حلولاً من الويب، حيث تصل إلى مصادر مثل Wolfram Alpha و MathPapa و Cymath. يبقى أن نرى مع المعادلات الأكثر تقدماً التي ستعمل بها الأداة تماماً، ولكن من المنطقي أن تبني جوجل Google الميزة للمساعدة في أسئلة أكثر تعقيداً مثل إيجاد حل المعادلة من أجل قيمة معينة لـ x.
يمكن أن يستغرق الأمر بعض الوقت حتى تصبح الميزة متاحة للجميع، ومن المحتمل أيضاً أن تقوم جوجل Google بإلغاء العمل عليه تماماً.
إذا تم طرح أداة حل معادلات الرياضيات، فقد تتمكن من الحصول عليها بشكل أسرع عند تثبيت الإصدار التجريبي من تطبيق Google من خلال هذا الرابط، ولكن هذا ليس ضماناً.
تعمل شركة جوجل Google على تطوير ذكاء اصطناعي لمساعدة الأطباء في التعرف على سرطان الثدي وفقاً لما جاء في بحث نشرته مجلة Nature اليوم.
وقالت الشركة بأن هذا النموذج الذي يمسح صور الأشعة السينية المعروفة باسم صور mammograms قد قلل من عدد التشخيصات السلبية بنسبة 9.4 في المئة.
اليوم، يُعد سرطان الثدي هو السبب الرئيسي الثاني للوفاة بين النساء، حيث يتجاوزه فقط سرطان الرئة في القوة والانتشار بشكل عام.
الاكتشاف المبكر هو أفضل دفاع لدى معظم الناس في تحديد وعلاج المرض، ومع أن تصوير منطقة الثدي بالأشعة السينية هي أداة الكشف الأكثر شيوعاً إلا أنها تفتقد إلى عدد كبير من الحالات الخاصة.
في الدراسة التي مولتها جوجل استخدم الباحثون تصوير الثدي بالأشعة السينية لأكثر من 25000 امرأة في المملكة المتحدة و 3000 امرأة في الولايات المتحدة.
ووفقاً لمدونة جوجل فقد قام الفريق أولاً بتدريب الذكاء الاصطناعي على فحص صور الأشعة السينية ثم البحث عن علامات الإصابة بسرطان الثدي عن طريق تحديد التغييرات في المنطقة المصورة.
في نهاية المطاف، تمكنوا من تقليل نسبة التشخيصات السلبية الخاطئة بنسبة 9.4 في المئة وخفض نسبة التشخيصات الإيجابية الخاطئة بنسبة 5.7 في المئة للنساء في الولايات المتحدة.
في المملكة المتحدة حيث يقوم اثنان من أخصائيي الأشعة بالتحقق من النتائج قلل النموذج التشخيصات السلبيات الكاذبة بنسبة 2.7 في المائة وقلل من التشخيصات الإيجابيات الخاطئة بنسبة 1.2 في المائة.
هذا يعني أن أداء نموذج جوجل الذكي في التشخيص بات أفضل من الأطباء في الولايات المتحدة والمملكة المتحدة معاً.
ومع ذلك فإن النظام لم يكن مثالياً 100% حيث فشل في تحديد حالات إصابة بالسرطان كان الأطباء البشريين قد أشاروا إليها، وبالمقابل حدث العكس أيضاً.
لذلك حرصت جوجل على تأطير هذا المشروع كمشروع سيساعد أخصائيي الأشعة بدلاً من استبدالهم، حيث أن الجمع بين تشخيص النموذج وتشخيص الطبيب يمكن أن يعزز النتائج الإجمالية.
المشروع جزء من جهود جوجل المستمرة للتوسع في مجال الرعاية الصحية، حيث كان للشركة مجموعة من المشاريع التي تهدف من خلالها إلى توظيف الذكاء الاصطناعي في المجال الطبي.
في معرض CES 2019 الخاص بـ NVIDIA ، عرضت الشركة تقنية جديدة تسمى DLSS. العروض التوضيحية توضح الأداء الناجح الذي
تم التقاطه في الألعاب التي تتيح رسومات رائعة جديدة لتتبع الأشعة على بطاقات RTX. ولكن كيف يعمل؟
ما هو DLSS؟
يشير DLSS إلى التعلّم الفائق. هناك جزءان لهذه الفكرة،
ولكن دعونا نركز على الجزء الأول أولاً: أخذ العينات الفائقة.
أخذ العينات
الفائقة شيء
يمكنك القيام به على جهازك الآن. إنه يجعل اللعبة بشكل أساسي تعمل بدقة تتجاوز ما
يمكن أن تدعمه شاشتك.
هذا يبدو غريباً،
لكنه يمكن أن يساعد في تخفيف بعض الحواف القاسية في الرسومات متعددة الأضلاع. تدعم
بطاقات NVIDIA و AMD هذه التكنولوجيا بالفعل، كما تفعل بعض ألعاب الكمبيوتر الشخصي ذلك
من تلقاء نفسها.
الآن، إلى جزء التعلم
العميق. التعلم العميق عبارة عن مصطلح غامض: إنه يعني بشكل أساسي أن أطناناً
وأطنانًا من الحسابات تعمل على أجهزة عالية الطاقة في عملية تتحسن بمرور الوقت.
نسمي بعض هذه التطبيقات
الذكاء الاصطناعي (AI) ، لكن هذا تسمية خاطئة؛ النظام لا يتعلم
بأي معنى إنساني، إنه يتحسن فقط في عملية متكررة.
يدير نظام DLSS الخاص بشركة NVIDIA أخذ عينات فائقة على لعبة معينة، مراراً
وتكراراً، على بطاقات الرسومات في مراكز البيانات الضخمة.
إنها تحسب أفضل
الطرق لتطبيق تقنية أخذ العينات الفائقة على لعبة ذات معالجة متكررة على صور تلك
اللعبة — المضلعات والقوام التي تشكل ما تراه على شاشتك.
يظهر جزء التعلم
العميق في العملية هنا؛ يتعلم النظام قدر الإمكان الطريقة التي يجب أن تبدو
بها اللعبة وكيفية جعلها تبدو أفضل.
اجمع بين أخذ
العينات الفائقة لخطوط وأنسجة المضلع الأكثر سلاسة مع التعلم العميق لتطبيق
التحسينات العامة على لعبة ما، وستحصل على DLSS.
يتم تطبيق تقنيات
تحسين الصورة، المحسوبة بالفعل في مراكز بيانات NVIDIA ، سريعاً عبر مراكز معالجة Tensor في بطاقة RTX.
شرح مهندسو NVIDIA العملية وأظهروها لنا، وذلك باستخدام معيار
الرسومات في CES. كانت التحسينات التي تمت على إعداد غير DLSS مثيرة للإعجاب، حيث كانت القوام والمضلعات
أكثر سلاسة وأكثر وضوحاً.
كان هذا صحيحاً حتى
عندما كان الجهاز DLSS يعرض رسوماته عند إخراج أقل (1080 بكسل) من جهاز
غير DLSS (1440 بكسل).
كيف تجعل اللعبة
تسير بشكل أسرع؟
يطبق نظام DLSS تحسينات معممة على الصور المرئية للعبة،
خاصةً إذا كنت تقوم بتشغيل اللعبة مع تمكين تحسينات تتبع NVIDIA للبحث عن الأشعة.
يتيح تتبع البحث عن
الأشعة، الذي تم تقديمه لأول مرة باستخدام بطاقات RTX-series ، انعكاسات وظلال ونشر للضوء أكثر دقة مع
بعض النتائج المذهلة. لقد قمنا بالفعل بتغطية الطرق التي يمكن أن تتبعها الأشعة في
تحسين الصور المرئية داخل اللعبة.
لسوء الحظ، يزيد
تتبع الشعاع أيضاً من الحمل على وحدة معالجة الرسومات. الحمل كبير جداً لدرجة أن
العديد من الألعاب تقل عن مستوى 60 إطاراً لكل ثانية، حتى عند استخدام أحدث بطاقات
NVIDIA والمكونات المتطورة في باقي أجهزة
الكمبيوتر.
باستخدام التحسينات
المحسوبة مسبقاً لـ DLSS ، والتي تم بالفعل تجاوز عدد وحدات معالجة
الرسومات RTX في مراكز بيانات NVIDIA ، يمكن تحسين أداء الألعاب التي تدعم RTX.
في العرض التوضيحي CES، تم تمكين لعبة ذات تتبع للأشعة و DLSS على حد سواء داخل إطار أو اثنين من اللعبة
دون أن يتم تمكين أي تتبع للأشعة على الإطلاق. لوضعها ببساطة قدر الإمكان: يتيح DLSS للألعاب تشغيلها بشكل أسرع بكثير مع تأثيرات
إضاءة رائعة.
تخبرنا NVIDIA أن العملية ليست مثالية: تمكين DLSS قد يغسل القوام أو الهندسة في بعض الحالات
النادرة. لكن بشكل عام، يعتبر التحسين دراماتيكياً ويستحق التمكين إذا كان خياراً.
هل يمكن استخدام
بطاقتي DLSS؟
تعد DLSS إحدى ميزات نظام معالجة Tensor الخاص بشركة NVIDIA ، والموجودة على بنية Turing GPU في بطاقات RTX الجديدة.
إذا كان لديك بطاقة
رسومات GeForce RTX ، فيمكنك استخدام DLSS. إذا لم تقم بذلك، فلا يمكنك ذلك. لهذا، لا
يمكن لبطاقات سلسلة GeForce
GTX 900
و 1000 التي لا تزال تتمتع بشعبية الاستفادة من DLSS.
هل أحتاج إلى اتصال
ويب لاستخدامه؟
لا. في حين أن عملية
DLSS تستخدم كميات هائلة من أجهزة الحوسبة
السحابية – حقول خوادم NVIDIA الضخمة المليئة مع الإصدارات الصناعية من
بطاقات رسومات RTX – تقوم بالعملية على جهاز الكمبيوتر المحلي بمجرد
إعداد النظام وتمكينه. فقط تأكد من تمكين أحدث برامج التشغيل.
هل لعبتي متوافقة
مع DLSS؟
إليك المشكلة:
يتطلب جزء التعلم العميق في DLSS شهوراً من المعالجة في مراكز بيانات NVIDIA قبل أن يتم تطبيقها على ألعاب الكمبيوتر.
لذلك لكل لعبة
جديدة تظهر، تحتاج NVIDIA إلى تشغيل صفيفات GPU العملاقة لفترة طويلة من أجل إعداد DLSS.
بمجرد الانتهاء من
الرفع الثقيل، ستقوم NVIDIA بتحديث برامج تشغيل GPU وتمكين DLSS في الألعاب الجديدة، وعند هذه النقطة يمكن
للمطور تمكينها افتراضياً أو السماح بها كخيار رسومات في قائمة الإعدادات.
نظراً لأن نظام
التعلم العميق يجب أن ينظر إلى الأشكال الهندسية لكل لعبة على حدة لتحسين أداء تلك
اللعبة المحددة، فلا توجد طريقة للتغلب على نهج لعبة واحدة في كل مرة.
سوف تزداد السرعة
مع تحسين NVIDIA – ربما يحلق الوقت لأسابيع أو أيام للعبة
واحدة – لكن في الوقت الحالي يستغرق الأمر بعض الوقت.
في وقت كتابة هذا
التقرير (يناير 2019)، هناك لعبة واحدة فقط تحتوي على DLSS يمكنك تمكينها على كمبيوتر ألعاب في المنزل:
Final Fantasy XV.
حتى في شكل تجريبي ويعمل فقط على أعلى دقة. تُظهر الاختبارات المبكرة أنه، في الواقع، يعزز الإطارات بواقع 10 إلى 15 إطاراً في الثانية – أي نفس المقدار الذي تخسره من خلال تمكين تتبع أشعة RTX في الألعاب الأخرى.
في الوقت الحالي، لا تدعم FFXV تتبع الأشعة، لذلك لا يتم تطبيق تعزيز DLSS حيث تكون هناك حاجة إليه بالفعل.
أعلنت NVIDIA عن قائمة بالألعاب الحالية والقادمة التي
ستدعم DLSS في نهاية المطاف – من المفترض أن الشركة
تدير مراكز بياناتها في طور الاستعداد لها.
في الوقت الحاضر، أكدت NVIDIA دعم DLSS المقبل لخمس وعشرين لعبة، مع ألقاب بارزة بما في ذلك Hellblade: Senua’s Sacrifice ، ARK: Survival Evolved ، Atomic Heart ، Hitman 2 ، Mechwarrior V ، Battlegrounds ، Shadow of the Tomb Raider ، و We Happy.
في CES، أعلنت الشركة أيضاً أن Battlefield V و Anthem القادمة ستدعمان DLSS – وقد يكون الأخير قد تمت معالجته بحلول
الوقت الذي يكون فيه جاهزاً للإصدار.
الألعاب التي ستدعم
كلاً من تأثيرات تتبع أشعة RTX الحصرية ونظام DLSS الذي يدعم الأداء، قائمة قصيرة:
Anthem
Atomic Heart
Battlefield V
MechWarrior V
Shadow of the Tomb Raider
Justice Online
JX3
بطبيعة الحال، ستنمو هذه القائمة عندما يصبح المطورون أكثر راحة مع تتبع الأشعة، وتسهل NVIDIA عملية حساب DLSS وتسريعها، ويطلب اللاعبون من أجهزة الكمبيوتر الشخصية الوصول إلى الميزات الكاملة لبطاقات الرسومات التي تحمل علامة RTX.
كشفت وكالة أنباء الصين Xinhua التي تديرها الدولة النقاب عن مذيع يعمل بواسطة الذكاء الاصطناعي، حيث أن المذيع الجديد هو عبارة عن تجميع لمواد رقمية مأخوذة من لقطات لمذيعين بشريين وباستخدام أصوات مركبة.
ليس من الواضح تماماً ما هي التكنولوجيا المستخدمة في إنشاء المذيع الجديد، ولكنها تتوافق مع أحدث الأبحاث التعليمية في مجالي الذكاء الاصطناعي والتعلم الآلي.
ويبدو أن وكالة Xinhua استخدمت لقطات من المذيعين البشريين كطبقة أساسية في صناعة المذيع الرقمي، ثم تم استخدام أجزاء متحركة من الفم والوجه لتحويل المتكلم إلى مذيع افتراضي.
من خلال الجمع بين الصورة والصوت المركب، تستطيع وكالة Xinhua برمجة المزيد من المذيعين الرقميين لقراءة الأخبار بطريقة أسرع بكثير من استخدام تقنيات CGI التقليدية بواسطة الحاسوب.
ووفقاً لتقارير من وكالة الأنباء Xinhua وصحيفة South China Morning Post فقد تم إنشاء اثنين من المذيعين الرقميين، أحدهما للبث باللغة الإنجليزية والآخر باللغة الصينية بالتعاون مع شركة محركات البحث المحلية Sogou.
وقالت وكالة Xinhua أن المذيع الرقمي لديه إمكانيات لا نهائية يمكن استعمالها لتوليد وقراءة تقارير إخبارية في أي وقت من اليوم على شبكات التلفزيون والويب والهواتف المحمولة.
من الواضح أن التكنولوجيا لها حدودها، ففي مقاطع الفيديو الموجودة نهاية المقالة يكون من الواضح أن نطاق تعبيرات الوجه محدودة والصوت تم إنتاجه بشكل مصطنع.
لكن بالمقابل فإن أبحاث التعلم الآلي في هذا المجال تحقق تحسناً سريعاً وليس من الصعب تخيل مستقبل قريب لا يمكن تمييز المذيعين الرقميين فيه عن المذيعين البشريين.
في حال لم تكن هذه التجربة عابرة، وتم تطوير العديد من الفرق الإخبارية التي تعمل بالذكاء الاصطناعي في مجال إعداد التقارير الإخبارية وقراءتها في النشرات اليومية فإن هذا سيثير المشكلة المتعلقة بالحاجة للوظائف البشرية.
حيث دخل الذكاء الاصطناعي في الفترة الأخيرة في الكثير من المجالات والأعمال التي كانت تُسند قبل فترة قصيرة إلى أشخاص بشريين يعملون في وظائفهم الاعتيادية مع رواتبهم الدورية.
لكن التطور السريع في مجال الذكاء الاصطناعي والذي لم يعد بإمكان أحد أن يوقفه أصبح المهدّد الأول للوظائف البشرية، بحيث لم يعد مستبعداً أن تتسبب التقنيات الذكية بفصل الموظفين البشريين من أعمالهم نتيجة عدم وجود حاجة إليهم!
بالنسبة إلى شركة بحجم جوجل Google، فإن مراكز البيانات الخاصة بها تكون عادةً هي الأكبر من نوعها على مستوى العالم، حيث يتم الاحتفاظ بآلاف الخوادم في تلك المراكز.
هذه الخوادم هي المسؤولة عن توفير كل شيء يتعلق بشركة جوجل، بدايةً من المعلومات الهائلة التي يمكن الحصول عليها من محرك البحث جوجل، ومروراً بكل الخدمات الأخرى مثل Gmail و Youtube.
التحدي الأساسي أمام جوجل هو المحافظة على درجة حرارة تلك المراكز ضمن المدى الطبيعي، وذلك لأن أي ارتفاع مفاجئ في درجة الحرارة وتعطل قسم من الخوادم قد يتسبب بكارثة في عالم الانترنت.
مؤخراً، بدأت جوجل بالاعتماد على تقنيات الذكاء الاصطناعي من أجل التحكم بأنظمة التبريد الخاصة بمراكز البيانات التابعة لها.
وقد قدّمت الشركة مجموعة من الاقتراحات حول كيفية زيادة كفاءة الطاقة مع المحافظة على درجة حرارة طبيعية، كما صرحت الشركة بأن الذكاء الاصطناعي الآن هو من يقود الأمر فيما يتعلق بأنظمة التبريد.
لم تطور الشركة النظام الجديد في خطة واحدة، بل بدأ الأمر بتطوير نظام بسيط مساعد للتحكم بأنظمة التبريد، لكن مع اكتشاف وسائل وتقنيات مختلفة بدأ المشروع يتوسع شيئاً فشيئاً.
بالإضافة إلى ذلك فإن القيام بالأعمال اليدوية فيما يخص بالتحكم بأنظمة التبريد كان يحتاج إلى الكثير من الوقت والجهد، الأمر الذي دفع بالشركة إلى الإسراع في تطوير المشروع ليصل إلى شكله الحالي.
وعلى الرغم من أن الحاجة للعمّال والفنيين ما زالت متواجدة، لكن الآن نظام الذكاء الاصطناعي قادر على إدارة أنظمة التبريد بمفرده من خلال إعطاء الأوامر وتنفيذ الإجراءات دون تدخل العنصر البشري.
بحسب جوجل فإن نظام الذكاء الاصطناعي قد تم تطبيقه لبضعة أشهر، وهو ما ساعد على توفير الطاقة بنسبة تصل إلى 30%.
كما وتخطط الشركة إلى دعم النظام الحالي بالمزيد من التقنيات والخوارزميات المناسبة، والتي ستساعد في النهاية على نقل هذه التجربة من مراكز البيانات إلى أقسام أخرى.
مما يبشر بحضور قوي للذكاء الاصطناعي في جميع المجالات خلال السنوات القليلة القادمة!
يُعد كل من موضوع تعلم الآلة وموضوع الذكاء الاصطناعي من أكثر الموضوعات تداولاً في الوقت الحالي في عالم التكنولوجيا، ويبدو أن شركة جوجل Google تتطلع إلى جعل هذه المواضيع أكثر قابليةً للوصول للمزيد من الأشخاص وذلك من خلال موقعها الجديد Learn with Google AI.
جوجل كانت قد سعت سابقاً إلى نشر مفاهيم الذكاء الاصطناعي لفترة من الوقت، وذلك من خلال مشاريع متقدمة مثل TensorFlow ومشاريع مسلية مثل cat doodles، وتهدف تجربة رؤية الآلات إلى عرض مشاريع الذكاء الاصطناعي بطرق أكثر عملية.
موقع جوجل الجديد Learn with Google AI يبدو وكأنه مستودع لتعلم الآلة والذكاء الاصطناعي، ومن المفترض أن يكون مركزاً لأي شخص يود الاطلاع على مفاهيم تعلم الآلة الرئيسية، وتطوير وصقل المهارات الخاصة بموضوع تعلم الآلة، وتطبيق مفاهيم تعلم الآلة على المسائل في العالم الحقيقي، وبالتالي فإن الموقع يظهر وكأنه وجهة مثالية لكل عشاق الذكاء الاصطناعي ومن مختلف المستويات، من المبتدئين وحتى الباحثين أو المتمرسين في هذا المجال.
يحتوي الموقع أيضاً على دورة مجانية مخصصة للاطلاع على مفاهيم تعلم الآلة، وهي متواجدة على الموقع باسم MLCC اختصاراً لـ Machine Learning Crash Course، حيث تستند هذه الدورة التدريبية إلى دورة تدريبية داخلية من جوجل تم تصميمها في الأصل من أجل العمل على منح موظفي الشركة مقدمة عملية لأساسيات الذكاء الاصطناعي ومبادئ تعلم الآلة، وذلك بمشاركة حوالي 18 ألف موظف في هذه الدورة.
أما الآن فإن شركة جوجل تقدم دورة MLCC بشكل مجاني وللجميع دون استثناء وذلك من خلال موقعها الجديد، حيث سيتم تقديم التدريبات والتصورات التفاعلية وأشرطة الفيديو التعليمية التي تساعد على معرفة مفاهيم تعلم الآلة.
تم تحديد مدة الدورة بـ 15 ساعة، وهي تتضمن دروس تفاعلية ومحاضرات علمية من Google researchers إلى جانب أكثر من 40 تدريب وتطبيق عملي، وتبدو الدورة مصممة للأشخاص الذين ليس لديهم خبرة أو تجارب عملية في هذا المجال، على الرغم من أن الشركة توصي بضرورة إتقان مبادئ الجبر وتوافر بعض الخبرة في أساسيات البرمجة واستخدام اللغة البرمجية Python لدى المتدربين، ويشار إلى أن دورة MLCC ستكون البداية فقط في مشروع الشركة الذي تعتزم فيه تقديم عدد من الدورات والموارد المتاحة في المستقبل القريب.
يمكنك زيارة موقع جوجل الجديد المتخصص بتعلم الذكاء الاصطناعي ومفاهيم تعلم الآلة من هنا.
يقوم موقع Reddit مؤخراً بنشر أخبار بمواضيع Subreddit مجدداً حيث يستخدم الناس أداة تعلم الآلة MachineLearning تدعى “Deep Fake” لاستبدال تلقائي لوجه شخص ما بآخر في فيديو, وبالطبع بما أننا على الإنترنت يستخدمها الناس لشيئين: تزوير مقاطع إباحية للمشاهير و إدخال الممثل الشهير نيكولاس كيج إلى أفلام عشوائية .
في حين أن عملية استبدال وجه شخص ما في صورة تعتبر سهلة نسبياً, ولكن عملية استبداله في فيديو صعبة وتستغرق وقتاً طويلاً وحتى الآن تم القيام بها بشكل أساسي في استوديوهات المؤثرات البصرية في أفلام هوليوود ذات الميزانية الكبيرة عندما يتم استبدال وجه البديل عن الممثل بالمشاهد الخطرة (الدوبلير) بوجه الممثل الأساسي, ولكن الآن أي شخص يملك حاسوب يستطيع القيام بذلك بسرعة وبشكل آلي.
قبل التعمق بالحديث عن DeepFake عليك أن تعلم كيف يبدو الفيديو المزور, اطلع على الفيديو أدناه وهو عبارة عن مجموعة من الفيديوهات تحوي مشاهير استبدلت وجوههم ,نيك كيج بشكل رئيسي:
برمجية Deep Fake تعمل باستخدام تعلم الآلة Machine Learning يتم تدريبها أولاً مع وجه الهدف ثم يتم إدخال صور محرفة للهدف بالخوارزمية فتتعلم كيف تصححهم ليماثلوا وجه الهدف دون تغيير, وعندما يتم إدخال صور شخص آخر تفترض الخوارزمية أنها صور محرفة للهدف وتحاول تصحيحها, وتعمل برمجية Deep Fake على كل إطار على حدة لتحصل على فيديو .
السبب لما Deep Fake قد تم تطبيقها بشكل كبير على الممثلين فقط هو وجود الكثير من الصور لهم ومن زوايا مختلفة مما يجعل التدريب أكثر فعالية, ومع ذلك نظراً لكمية الصور والفيديو التي تنشر من قبل الناس على الانترنت وأنك تحتاج إلى 500 صورة فقط لتدرب الخوارزمية, ليس هناك سبب يمنع استهداف الأشخاص العاديين أيضاً ولكن بنسبة نجاح أقل على الأرجح.
كيفية كشف فيديو مزور باستخدام Deep Fake
يسهل الآن كشف الفيديو المزور باستخدام برمجية Deep Fake ولكن الأمر سيزداد صعوبة مع تطور التكنولوجيا, وهنا بعض الأشياء التي إذا لاحظتها في فيديو فهو على الأغلب مزور :
وجوه غريبة المنظر: في العديد من الفيديوهات المزورة باستخدام هذه البرمجية تبدو الوجوه فيها غريبة, إذ لا تصطف الملامح بشكل صحيح وكل شيء يبدو مغطى بالشمع كما في الصورة أدناه, إذا بدا كل شيء آخر طبيعياً ولكن يبدو الوجه غريباً فعلى الأغلب تم التزوير باستخدام Deep Fake.
وميض: سمة مشتركة بين الفيديوهات المزورة الرديئة ويبدو الوجه فيها وامضاً وتظهر الملامح الأصلية في بعض الأحيان لوهلة قصيرة, ويبدو ذلك واضحاً أكثر على أطراف الوجه أو عندما يمر شخص من أمامه, إذا ظهر وميض غريب فالفيديو مزور على الأغلب.
أجسام مختلفة: تعمل برمجية Deep Fake على استبدال الوجوه فقط, ومعظم الناس تحاول الحصول على جسم مطابق بشكل جيد ولكن ذلك ليس ممكن دائماً, إذا كان الشخص يبدو أطول أو أنحف أو أقصر بشكل ملحوظ أو لديه وشوم لا يملكها بالحقيقة أو بالعكس, فهناك إحتمال كبير أن الفيديو مزور. يمكنك أن ترى مثالاً واضحاً أدناه حيث تم استبدال وجه الممثلJ.K. Simmons في مشهد من فيلم Whiplash بوجه الممثل Patrick Stewart ولكن سيمونز في الحقيقة ذو بنية جسدية أصغر بكثير من ستيوارت مما جعل ذلك يبدو غريباً.
مقاطع قصيرة: حالياً حتى عندما تعمل البرمجية بشكل مثالي وتتم عملية استبدال الوجه بشكل لا يمكن تميزه, فإنها في الحقيقة يمكنها فعل ذلك لمدة قصيرة, فبعد مدة ليست بطويلة, إحدى المشاكل المذكورة أعلاه ستبدأ بالحدوث, وهذا هو سبب أن معظم المقاطع المزورة التي يتشاركونها الناس تبلغ بضع ثوان فقط فإن بقية اللقطات غير صالحة للاستعمال. إذا شاهدت مقطعاً قصيراً للغاية لأحد المشاهير يفعل شيئاً ما وليس هناك سبب وجيه لما أنه قصير جداً فهذا دليل أنه مزور باستخدام برمجية Deep Fake.
بلا صوت أو تزامن شفاه سيء: برمجية Deep Fake تعدل على الملامح فقط, فهي لا تجعل صوت شخص ما يبدو كآخر سحرياً, إذا كان المقطع بلا صوت وليس هناك أي سبب لعدم وجود صوت فهذا دليل آخر أنه مزور باستخدام برمجية Deep Fake, وبالمثل حتى لو يوجد صوت إذا كانت الكلمات المنطوقة لا تتطابق مع الشفاه المتحركة بشكل صحيح أو بدت الشفاه غريبة بينما يتكلم الشخص فيحتمل أن الفيديو مزور.
مقاطع غير معقولة: هذا النوع غني عن القول فإذا شاهدت مقطع يستحيل تصديقه فهناك احتمال كبير أنه مزور فمثلاً نيكولاس كيج لم يمثل أبداً شخصية لوكي Loki بفلم من مارفل على الرغم من أنه سيكون رائعاً لو حدث.
مصادر مشكوك فيها: كما هو الحال مع الصور المزورة حيث مصدر الفيديو المفترض غالباً يكون دليل كبير على صحته, فإن كان محور قصة على صحيفة النيويورك تايمز New York Times فاحتمال صحته أكبر بكثير من احتمال صحته لو كان من موقع ما على الإنترنت.
في الوقت الحالي برمجية Deep Fake هي مجرد فضول مرعب وليست بمشكلة كبيرة فالنتائج سهلة الكشف وفي حين أنه من المستحيل التغاضي عن ما يجري القيام به, لم يقدم أحد على تمرير فيديو مزور على أنه فيديو حقيقي.
ولكن مع تطور التكنولوجيا من المرجح أن تصبح مشكلة أكبر بكثير فعلى سبيل المثال تزييف لقطات مقنعة لزعيم كوريا الشمالية كيم جونغ أون يعلن فيها الحرب على الولايات المتحدة الأمريكية يمكنها أن تسبب الذعر بين المواطنين على مستوى هائل.