مايكروسوفت أنشأت نظاماً لوصف الصور يعتمد على الذكاء الاصطناعي

وهو الأكثر دقة حتى الآن

397

أنشأت مايكروسوفت Microsoft نظاماً جديداً لتسمية الصور عن طريق الذكاء الاصطناعي، حيث قام بوصف الصور بدقة أكبر من البشر في اختبارات محدودة.

وتم إضافة هذا النموذج إلى تطبيق Seeing AI، وهو تطبيق مجاني للأشخاص الذين يعانون من إعاقات بصرية، حيث يستخدم كاميرا الهاتف الذكي لقراءة النص، وتحديد الأشخاص، ووصف الأشياء والمناطق المحيطة.

كما أنه متاح الآن لمطوري التطبيقات من خلال Computer Vision API في Azure Cognitive Services، وسيتم طرحه في كل من مايكروسفت وورد Microsoft Word وآوت لوك Outlook وبور بوينت PowerPoint في وقت لاحق من هذا العام.

ويمكن للنظام الجديد إنشاء أوصاف الصور أو ما يعرف ب “النص البديل” للصور في صفحات الويب والمستندات، وهي ميزة مهمة للأشخاص ذوي الرؤية المحدودة والتي غالباً ما تكون غير متوفرة.

وقال Saqib Shaikh ، مدير هندسة البرمجيات في شركة Microsoft: “من الناحية المثالية، قد يقوم الجميع بتضمين نص بديل لجميع الصور في المستندات، وعلى الويب،وفي وسائل التواصل الاجتماعي – حيث يتيح ذلك للأشخاص المكفوفين الوصول إلى المحتوى والمشاركة في المحادثة”.

وأضاف: “لكن للأسف، الناس لا يفعلون ذلك. لذلك، هناك العديد من التطبيقات التي تستخدم التسميات التوضيحية للصور كطريقة لملء النص البديل عندما يكون مفقوداً “.

وجاءت هذه الخوارزمية الجديدة من مايكروسوفت على رأس قائمة المتصدرين لمعيار التسمية التوضيحية للصور المسمى nocaps.

وحققت مايكروسوفت Microsoft ذلك من خلال التدريب المسبق لنموذج كبير للذكاء الاصطناعي على مجموعة بيانات من الصور المقترنة بكلمات وسمية (Tag)، بدلاً من التسميات التوضيحية الكاملة، والتي تكون أقل كفاءة في الإنشاء.

حيث تم إقران كل وسم بكائن معين في الصورة، ثم تم بعد ذلك ضبط النموذج المدرَّب مسبقاً على مجموعة بيانات من الصور الموصوفة، مما مكنه من تكوين جمل.

وادعت مايكروسوفت Microsoft أن هذا النموذج أفضل بمرتين من النموذج المستخدم في المنتجات منذ عام 2015. حيث توضح الصورة أدناه مقدار التحسن في وصف الصورة:

نظام الذكاء الاصطناعي القديم وصف هذه الصورة على أنها “شخص يجلس على طاولة، ويستخدم حاسوب محمول”، أما نظام مايكروسوفت الجديد وصفها “شخص يستخدم مجهر”.

ومع ذلك، فإن إنجاز الأداء المعياري لا يعني أن النموذج سيكون أفضل من البشر في شرح الصور في العالم الحقيقي، حيث ذكر Harsh Agrawal أحد مؤسسي المعيار، أن مقاييس التقييم الخاصة به “ترتبط فقط تقريباً بتفضيلات الإنسان” وأنها “تغطي فقط نسبة مئوية صغيرة من جميع المفاهيم المرئية الممكنة”.

مقالات قد تعجبك

مراجعة هاتف سامسونج Galaxy M31 Prime Edition المتميز ببطارية بسعة ضخمة
شركة Infinix أعلنت رسمياً عن هاتفي Note 8 و Note 8i
الإعلان رسمياً عن هاتف Oppo A15 بسعر 150 دولار فقط
كيف تعمل الهواتف القابلة للطيّ ؟
ما أسباب ارتفاع حرارة الهواتف الذكية؟ وما الحلول؟
لم لا يجب العودة من ويندوز 10 إلى ويندوز 8.1؟

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept