جوجل تعمل على أداة لقراءة وصفات الأطباء

أعلنت شركة جوجل عن عملها على أداة تمكن المستخدمون من قراءة وصفات الأطباء، والتي دائمًا ما تُكتب بخط يصعب قراءته حتى على الصيادلة أنفسهم. ذلك نقلًا عن The Verge.

جاء ذلك الإعلان ضمن مؤتمر جوجل السنوي الذي يُقعد في الهند، حيث أعلنت، وفقًا لـ TechCrunch، عن تعاونها مع مجموعة من الصيادلة لإنشاء أداة بالذكاء الاصطناعي قادرة على تفسير خط الأطباء.

لم تعلن الشركة عن موعد طرح تلك الأداة، كما لم تحدد ما إذا كانت الأداة ستكون مستقلة أو ملحقة مع إحدى تطبيقات جوجل.

فيما يلي مقتطف من مدونة جوجل الهند حول الخاصية الجديدة:

أعلنا اليوم عن نموذج حديث للذكاء الاصطناعي وتعلم الآلة يمكنه التعرف على الأدوية وحتى إبرازها ضمن الوصفات الطبية المكتوبة بخط اليد. سيكون هذا بمثابة تقنية مساعدة لرقمنة المستندات الطبية المكتوبة بخط اليد من خلال زيادة عدد الأشخاص الموجودين في الحلقة مثل الصيادلة، ولكن لن يتم اتخاذ أي قرار بناءً على المخرجات التي توفرها هذه التقنية فقط.

بينما يكون هذا النظام قيد التطوير حاليًا، فإننا نتطلع إلى مشاركة المزيد من التحديثات حول طرحه على نطاق أوسع.

قدمت جوجل بالفعل تقنية مشابهة من خلال Google Lens، وهي أداة التعرف على الأشياء متعددة الأغراض باستخدام الذكار الاصطناعي، والتي يمكن استخدامها للتعرف على الأشياء (مثل المنتجات أو النباتات أو أنواع الحيوانات) وترجمة اللغات. يمكن بالفعل استخدام تطبيق Google Lens لنسخ الملاحظات المكتوبة بخط اليد رقميًا، ومع ذلك، فإنها تعتمد على مدى وضوح الخط.

إنفيديا تتعاون مع مايكروسوفت لتطوير حواسيب الذكاء الاصطناعي الخارقة

أعلنت شركة إنفيديا عن “تعاون متعددة سنوات” مع شركة مايكروسوفت لبناء ما سمته “أقوى حواسيب الذكاء الاصطناعي الخارقة في العالم،” والتي تهدف إلى معالجة عمليات الحوسبة الضخمة لتدريب الذكاء الاصطناعي. ذلك نقلًا عن The Verge.

سيشهد التعاون استخدام إنفيديا لمثيلات الأجهزة الافتراضية القابلة للتطوير من مايكروسوفت لتسريع التقدم في نماذج الذكاء الاصطناعي التوليدية مثل DALL-E.

استنادًا إلى البنية التحتية السحابية Azure من مايكروسوفت، سيستخدم حاسوب الذكاء الاصطناعي الخارق عشرات الآلاف من وحدات معالجة الرسومات القوية H100 وA100 المصممة لمركز البيانات من إنفيديا ومنصة الشبكة Quantum-2 InfiniBand.

وفقًا لإنفيديا، فإن الجمع بين منصة Azure ووحدات معالجة الرسومات والشبكات ومجموعة الذكاء الاصطناعي الكاملة من إنفيديا سيسمح لمزيد من المؤسسات بتدريب ونشر وتوسيع نطاق الذكاء الاصطناعي، بما في ذلك النماذج الكبيرة والحديثة. ستعمل الشركتان أيضًا على تطوير DeepSpeed، وهو برنامج تحسين التعلم العميق من مايكروسوفت.

صرحت الشركة في بيان لها أنه يمكن استخدام الحاسوب الخارق في “البحث وزيادة تسريع التقدم في الذكاء الاصطناعي التوليدي،” فئة جديدة نسبيًا من نماذج اللغات الكبيرة مثل DALL-E وStable Diffusion التي تستخدم خوارزميات التعلم الذاتي لإنشاء مجموعة متنوعة من المحتوى، مثل النصوص، الأكواد، الصور الرقمية، الفيديوهات، والصوتيات. شهدت نماذج الذكاء الاصطناعي هذه نموًا سريعًا في السنوات الأخيرة مما أدى إلى زيادة الطلب بشكل كبير على أقوى أنظمة الحوسبة القادرة على التوسع جنبًا إلى جنب مع تطورها.

قال السيد مانوفير داس، نائب رئيس قسم حوسبة الشركات لدى إنفيديا ” إن تسارع تقدم تكنولوجيا الذكاء الاصطناعي وكذلك اعتماد الصناعة. أدى الاختراق في نماذج الأساس إلى موجة مد وجزر من البحث، تعزيز الشركات الناشئة الجديدة، وتمكين تطبيقات مؤسسية جديدة. سيوفر تعاوننا مع مايكروسوفت للباحثين والشركات أحدث بنية تحتية للذكاء الاصطناعي وبرمجيات للاستفادة من القوة التحويلية للذكاء الاصطناعي.”

اقرأ أيضًا: منصة GitHub تختبر إمكانية كتابة الأكواد عن طريق الصوت

ما هو التعلم الآلي Machine Learning؟

لتعلم مهارة، نحتاج لجمع المعرفة والتدرب بعناية، ومراقبة أدائنا. في النهاية، نصبح أفضل في هذا النشاط. التعلم الآلي هو أسلوب يسمح لأجهزة الكمبيوتر بالقيام بذلك.

هل يمكن لأجهزة الكمبيوتر أن تتعلم؟

تعريف الذكاء صعب. نعلم جميعاً ما نعنيه بالذكاء عندما نقولها، لكن وصفها يمثل مشكلة.

بغض النظر عن العاطفة والوعي الذاتي، يمكن أن يكون التوصيف العملي هو القدرة على تعلم مهارات جديدة واستيعاب المعرفة وتطبيقها على مواقف جديدة لتحقيق النتيجة المرجوة.

نظراً لصعوبة تعريف الذكاء، لن يكون تعريف الذكاء الاصطناعي أسهل. لذا، سنلتف على الموضوع قليلاً. إذا كان جهاز الكمبيوتر قادراً على القيام بشيء يتطلب عادةً التفكير البشري والذكاء، فسنقول أنه يستخدم الذكاء الاصطناعي!

على سبيل المثال، يمكن للمتحدثين الأذكياء مثل Amazon Echo و Google Nest سماع تعليماتنا المنطوقة، وتفسير الأصوات على أنها كلمات، واستخراج معنى الكلمات، ثم محاولة تلبية طلبنا. قد نطلب منه تشغيل الموسيقى أو الإجابة على سؤال أو إطفاء الأضواء.

يتم نقل أوامرك المنطوقة إلى أجهزة كمبيوتر قوية في سحابات الشركات المصنعة، حيث يتم تنفيذ الأوامر التي تتطلب الذكاء الاصطناعي.

يتم تحليل الأمر واستخراج المعنى وإعداد الاستجابة وإرسالها مرة أخرى إلى السماعة الذكية.

يدعم التعلم الآلي غالبية أنظمة الذكاء الاصطناعي التي نتفاعل معها. بعض هذه العناصر موجودة في منزلك مثل الأجهزة الذكية، والبعض الآخر جزء من الخدمات التي نستخدمها عبر الإنترنت.

تستخدم توصيات الفيديو على يوتيوب YouTube ونتفليكس Netflix وقوائم التشغيل التلقائية على سبوتيفاي Spotify التعلم الآلي.

تعتمد محركات البحث على التعلم الآلي، ويستخدم التسوق عبر الإنترنت التعلم الآلي ليقدم لك اقتراحات الشراء بناءً على سجل التصفح وسجل الشراء.

يمكن لأجهزة الكمبيوتر الوصول إلى مجموعات بيانات هائلة. يمكنهم تكرار العمليات بلا كلل آلاف المرات في الوقت الذي سيستغرقه الإنسان لإجراء تكرار واحد، هذا إذا تمكن الإنسان من القيام بذلك مرة واحدة.

لذلك، إذا كان التعلم يتطلب المعرفة والممارسة وردود الفعل على الأداء، فيجب أن يكون الكمبيوتر هو المرشح المثالي.

هذا لا يعني أن الكمبيوتر سيكون قادراً حقاً على التفكير بالمعنى البشري، أو الفهم والإدراك كما نفعل نحن. لكنه سيتعلم ويتحسن بالممارسة.

يمكن لنظام التعلم الآلي، المبرمج بمهارة، أن يحقق انطباعاً لائقاً عن كيان واعي وواعي.

اعتدنا أن نسأل، “هل يمكن لأجهزة الكمبيوتر أن تتعلم؟” تحول ذلك في النهاية إلى سؤال عملي أكثر. ما هي التحديات الهندسية التي يجب التغلب عليها للسماح لأجهزة الكمبيوتر بالتعلم؟

الشبكات العصبونية والشبكات العصبونية العميقة:

تحتوي أدمغة الحيوانات على شبكات من الخلايا العصبية. يمكن للخلايا العصبية إرسال إشارات عبر المشبك إلى الخلايا العصبية الأخرى.

هذا العمل الصغير -الذي يتم تكراره ملايين المرات- يؤدي إلى عمليات تفكيرنا وذكرياتنا. من بين العديد من اللبنات الأساسية، خلقت الطبيعة عقولاً واعية والقدرة على التفكير والتذكر.

مستوحاة من الشبكات العصبية البيولوجية، تم إنشاء الشبكات العصبونية الاصطناعية لتقليد بعض خصائص نظيراتها العضوية.

منذ أربعينيات القرن الماضي، تم تطوير الأجهزة والبرامج التي تحتوي على آلاف أو ملايين العقد. تستقبل العقد (مثل الخلايا العصبية) إشارات من العقد الأخرى.

يمكنهم أيضاً إنشاء إشارات لتغذية العقد الأخرى. يمكن للعقد قبول المدخلات من العديد من العقد وإرسال إشارات إليها في وقت واحد.

إذا استنتج حيوان ما أن الحشرات الطائرة الصفراء والسوداء دائماً ما تسبب له لدغة سيئة، فسوف يتجنب كل الحشرات الطائرة الصفراء والسوداء. تستفيد حشرة الحوامة من هذا الشيء.

إنها ذات لون أصفر وأسود مثل الدبور، لكن ليس لها لدغة. الحيوانات التي تشابكت مع الدبابير وتعلمت درساً مؤلماً منها، ستخاف من الحوامة وتفسح لها طريقاً واسعاً أيضاً.

سترى هذه الحيوانات حشرة طائرة ذات ألوان مشابهة للدبور وتقرر أن الوقت قد حان للتراجع. حقيقة أن الحشرة يمكن أن تحوم والدبابير لا تستطيع لا تُؤخَذ بعين الاعتبار.

يستخدم التعلم الآلي الإحصائيات للعثور على أنماط في مجموعات البيانات التي تم التدريب عليها.

قد تحتوي مجموعة البيانات على كلمات أو أرقام أو صور أو تفاعلات المستخدم مثل النقرات على موقع ويب أو أي شيء آخر يمكن التقاطه وتخزينه رقمياً.

يحتاج النظام إلى توصيف العناصر الأساسية للاستعلام ثم مطابقتها مع الأنماط التي اكتشفها في مجموعة البيانات.

إذا كان يحاول التعرف على زهرة، فسيحتاج إلى معرفة طول الساق وحجم الورقة ونمطها ولون وعدد البتلات وما إلى ذلك.

في الواقع، ستحتاج إلى حقائق أكثر بكثير من تلك، ولكن في مثالنا البسيط، سنستخدمها.

بمجرد أن يعرف النظام تلك التفاصيل حول عينة الاختبار، يبدأ عملية اتخاذ القرار التي تنتج تطابقاً من مجموعة البيانات الخاصة به. بشكل مثير للإعجاب، تُنشئ أنظمة التعلم الآلي شجرة القرار بنفسها.

يتعلم نظام التعلم الآلي من أخطائه عن طريق تحديث خوارزمياته لتصحيح العيوب في منطقه. أكثر الشبكات العصبونية تعقيداً هي الشبكات العصبونية العميقة.

من الناحية المفاهيمية، تتكون هذه الشبكات العصبونية من عدد كبير جداً من الشبكات العصبونية الموجودة في طبقات فوق الأخرى. يمنح هذا النظام القدرة على اكتشاف واستخدام حتى الأنماط الصغيرة في عمليات اتخاذ القرار الخاصة به.

تُستخدم الطبقات بشكل شائع لتوفير عمليات الترجيح. يمكن لما يسمى بالطبقات المخفية أن تعمل بمثابة طبقات متخصصة.

أنها توفر إشارات مرجحة حول خاصية واحدة لموضوع الاختبار. ربما يستخدم مثال تعريف الزهرة لدينا طبقات مخفية مخصصة لشكل الأوراق أو حجم البراعم أو أطوال السداة.

أنواع التعلم المختلفة:

هناك ثلاث تقنيات واسعة تُستخدم لتدريب أنظمة التعلم الآلي: التعلم الخاضع للإشراف، والتعلم غير الخاضع للإشراف، والتعلم المعزز.

التعلم الخاضع للإشراف:

التعلم الخاضع للإشراف هو أكثر أشكال التعلم استخداماً. هذا ليس لأنه متفوق بطبيعته على التقنيات الأخرى. يتعلق الأمر أكثر بمدى ملاءمة هذا النوع من التعلم لمجموعات البيانات المستخدمة في أنظمة التعلم الآلي التي تتم كتابتها اليوم.

في التعلم الخاضع للإشراف، يتم تصنيف البيانات وتنظيمها بحيث يتم تحديد المعايير المستخدمة في عملية صنع القرار لنظام التعلم الآلي. هذا هو نوع التعلم المستخدم في أنظمة التعلم الآلي وراء اقتراحات قوائم تشغيل يوتيوب YouTube.

تعليم غير مشرف عليه:

لا يتطلب التعلم غير الخاضع للإشراف إعداد البيانات. لم يتم تصنيف البيانات. يقوم النظام بمسح البيانات، ويكشف عن الأنماط الخاصة به، ويشتق معايير التشغيل.

تم تطبيق تقنيات التعلم غير الخاضعة للإشراف على الأمن السيبراني مع معدلات نجاح عالية. يمكن لأنظمة الكشف عن الدخيل التي تم تحسينها بواسطة التعلم الآلي أن تكتشف نشاط الشبكة غير المصرح به للمتطفل لأنه لا يتطابق مع أنماط السلوك التي لوحظت سابقاً للمستخدمين المصرح لهم.

التعلم المعزز:

التعلم المعزز هو الأحدث بين التقنيات الثلاثة. ببساطة، تستخدم خوارزمية التعلم المعزز التجربة والخطأ وردود الفعل للوصول إلى نموذج السلوك الأمثل لتحقيق هدف معين.

وهذا يتطلب ردود فعل من البشر الذين يسجلون جهود النظام وفقاً لما إذا كان سلوكه له تأثير إيجابي أو سلبي في تحقيق هدفه.

الجانب العملي من الذكاء الاصطناعي:

نظراً لأنه منتشر جداً وله نجاحات يمكن إثباتها في العالم الحقيقي، بما في ذلك النجاحات التجارية، فقد أطلق على التعلم الآلي اسم الجانب العملي للذكاء الاصطناعي.

إنه نشاط تجاري ضخم، وهناك العديد من الأطر التجارية القابلة للتطوير والتي تتيح لك دمج التعلم الآلي في عمليات التطوير أو المنتجات.

إذا لم تكن لديك حاجة فورية لهذا النوع من القوة ولكنك مهتم بالبحث عن نظام للتعلم الآلي بلغة برمجة مثل Python، فهناك موارد مجانية ممتازة لذلك أيضاً.

  • Torch هو إطار عمل مفتوح المصدر للتعلم الآلي معروف بسرعته.
  • Scikit-Learn عبارة عن مجموعة من أدوات التعلم الآلي، خاصة للاستخدام مع لغة Python.
  • Caffe هو إطار عمل للتعلم العميق، وهو متخصص بشكل خاص في معالجة الصور.
  • Keras عبارة عن إطار عمل للتعلم العميق بواجهة Python.

مقالات قد تعجبك:

ما الأفضل . التعاريف المدمجة في Windows مسبقاً أم تعاريف الشركة المصنعة ؟
كيفية تنصيب التعاريف لجميع الأجهزة في حاسوبك من الإنترنت على مختلف أنظمة Windows
كيفية تحسين أداء الألعاب عند استخدام كروت الشاشة من نوع Intel
كيفية ترقية أو استبدال بطاقة واي فاي للكمبيوتر المحمول
كيفية ترقية أو استبدال بطاقة واي فاي للكمبيوتر المكتبي

كيفية اكتشاف الفيديو المزور ببرمجية Deep Fake لاستبدال الأوجه

يقوم موقع Reddit مؤخراً بنشر أخبار بمواضيع Subreddit مجدداً حيث يستخدم الناس أداة تعلم الآلة Machine Learning تدعى “Deep Fake” لاستبدال تلقائي لوجه شخص ما بآخر في فيديو, وبالطبع بما أننا على الإنترنت يستخدمها الناس لشيئين: تزوير مقاطع إباحية للمشاهير و إدخال الممثل الشهير نيكولاس كيج إلى أفلام عشوائية .

في حين أن عملية استبدال وجه شخص ما في صورة تعتبر سهلة نسبياً, ولكن عملية استبداله في فيديو صعبة وتستغرق وقتاً طويلاً وحتى الآن تم القيام بها بشكل أساسي في استوديوهات المؤثرات البصرية في أفلام هوليوود ذات الميزانية الكبيرة عندما يتم استبدال وجه البديل عن الممثل بالمشاهد الخطرة (الدوبلير) بوجه الممثل الأساسي, ولكن الآن أي شخص يملك حاسوب يستطيع القيام بذلك بسرعة وبشكل آلي.

قبل التعمق بالحديث عن Deep Fake عليك أن تعلم كيف يبدو الفيديو المزور, اطلع على الفيديو أدناه وهو عبارة عن مجموعة من الفيديوهات تحوي مشاهير استبدلت وجوههم ,نيك كيج بشكل رئيسي:

برمجية Deep Fake تعمل باستخدام تعلم الآلة Machine Learning يتم تدريبها أولاً مع وجه الهدف ثم يتم إدخال صور محرفة للهدف بالخوارزمية فتتعلم كيف تصححهم ليماثلوا وجه الهدف دون تغيير, وعندما يتم إدخال صور شخص آخر تفترض الخوارزمية أنها صور محرفة للهدف وتحاول تصحيحها, وتعمل برمجية Deep Fake على كل إطار على حدة لتحصل على فيديو .

السبب لما Deep Fake قد تم تطبيقها بشكل كبير على الممثلين فقط هو وجود الكثير من الصور لهم ومن زوايا مختلفة مما يجعل التدريب أكثر فعالية, ومع ذلك نظراً لكمية الصور والفيديو التي تنشر من قبل الناس على الانترنت وأنك تحتاج إلى 500 صورة فقط لتدرب الخوارزمية, ليس هناك سبب يمنع استهداف الأشخاص العاديين أيضاً ولكن بنسبة نجاح أقل على الأرجح.

كيفية كشف فيديو مزور باستخدام Deep Fake

يسهل الآن كشف الفيديو المزور باستخدام برمجية Deep Fake  ولكن الأمر سيزداد صعوبة مع تطور التكنولوجيا, وهنا بعض الأشياء التي إذا لاحظتها في فيديو فهو على الأغلب مزور :

وجوه غريبة المنظر: في العديد من الفيديوهات المزورة باستخدام هذه البرمجية تبدو الوجوه فيها غريبة, إذ لا تصطف الملامح بشكل صحيح وكل شيء يبدو مغطى بالشمع كما في الصورة أدناه, إذا بدا كل شيء آخر طبيعياً ولكن يبدو الوجه غريباً فعلى الأغلب تم التزوير باستخدام Deep Fake.

وميض: سمة مشتركة بين الفيديوهات المزورة الرديئة ويبدو الوجه فيها وامضاً وتظهر الملامح الأصلية في بعض الأحيان لوهلة قصيرة, ويبدو ذلك واضحاً أكثر على أطراف الوجه أو عندما يمر شخص من أمامه, إذا ظهر وميض غريب فالفيديو مزور على الأغلب.

أجسام مختلفة: تعمل برمجية Deep Fake على استبدال الوجوه فقط, ومعظم الناس تحاول الحصول على جسم مطابق بشكل جيد ولكن ذلك ليس ممكن دائماً, إذا كان الشخص يبدو أطول أو أنحف أو أقصر بشكل ملحوظ أو لديه وشوم لا يملكها بالحقيقة أو بالعكس, فهناك إحتمال كبير أن الفيديو مزور. يمكنك أن ترى مثالاً واضحاً أدناه حيث تم استبدال وجه الممثل J.K. Simmons في مشهد من فيلم Whiplash بوجه الممثل Patrick Stewart ولكن سيمونز في الحقيقة ذو بنية جسدية أصغر بكثير من ستيوارت مما جعل ذلك يبدو غريباً.

مقاطع قصيرة: حالياً حتى عندما تعمل البرمجية بشكل مثالي وتتم عملية استبدال الوجه بشكل لا يمكن تميزه, فإنها في الحقيقة يمكنها فعل ذلك لمدة قصيرة, فبعد مدة ليست بطويلة, إحدى المشاكل المذكورة أعلاه ستبدأ بالحدوث, وهذا هو سبب أن معظم المقاطع المزورة التي يتشاركونها الناس تبلغ بضع ثوان فقط فإن بقية اللقطات غير صالحة للاستعمال. إذا شاهدت مقطعاً قصيراً للغاية لأحد المشاهير يفعل شيئاً ما وليس هناك سبب وجيه لما أنه قصير جداً فهذا دليل أنه مزور باستخدام برمجية Deep Fake.

بلا صوت أو تزامن شفاه سيء: برمجية Deep Fake تعدل على الملامح فقط, فهي لا تجعل صوت شخص ما يبدو كآخر سحرياً, إذا كان المقطع بلا صوت وليس هناك أي سبب لعدم وجود صوت فهذا دليل آخر أنه مزور باستخدام برمجية Deep Fake, وبالمثل حتى لو يوجد صوت إذا كانت الكلمات المنطوقة لا تتطابق مع الشفاه المتحركة بشكل صحيح أو بدت الشفاه غريبة بينما يتكلم الشخص فيحتمل أن الفيديو مزور.

مقاطع غير معقولة: هذا النوع غني عن القول فإذا شاهدت مقطع يستحيل تصديقه فهناك احتمال كبير أنه مزور فمثلاً نيكولاس كيج لم يمثل أبداً شخصية لوكي Loki  بفلم من مارفل على الرغم من أنه سيكون رائعاً لو حدث.

مصادر مشكوك فيها: كما هو الحال مع الصور المزورة حيث مصدر الفيديو المفترض غالباً يكون دليل كبير على صحته, فإن كان محور قصة على صحيفة النيويورك تايمز New York Times فاحتمال صحته أكبر بكثير من احتمال صحته لو كان من موقع ما على الإنترنت.

في الوقت الحالي برمجية Deep Fake هي مجرد فضول مرعب وليست بمشكلة كبيرة فالنتائج سهلة الكشف وفي حين أنه من المستحيل التغاضي عن ما يجري القيام به, لم يقدم أحد على تمرير فيديو مزور على أنه فيديو حقيقي.

ولكن مع تطور التكنولوجيا من المرجح أن تصبح مشكلة أكبر بكثير فعلى سبيل المثال تزييف لقطات مقنعة لزعيم كوريا الشمالية كيم جونغ أون يعلن فيها الحرب على الولايات المتحدة الأمريكية يمكنها أن تسبب الذعر بين المواطنين على مستوى هائل.