شركة OpenAI تسمح لأصحاب المواقع باستبعاد مواقعهم من تدريب الذكاء الاصطناعي ChatGPT

تحصل الشركة على بيانات التدريب من مواقع الإنترنت

253

كشفت شركة أوبن إي OpenAI للذكاء الاصطناعي عن السماح لأصحاب مواقع الويب من منع الشركة من استخدام مواقعهم للمساعدة في تدريب نماذج الذكاء الاصطناعي ChatGPT.

وبشكل أكثر تحديداً فإن الشركة قد أعطت الخيار لمطوري مواقع الويب بعدم السماح لزاحف الشبكة (عنكبوت الشبكة) الخاص بالشركة GPTBot من خلال ملف Robots.txt الخاص بالموقع، أو حظر عنوان IP الخاص به بشكل كامل.

وقالت الشركة: “قد تُستخدم صفحات الويب التي يتم الزحف إليها باستخدام GPTBot لتحسين النماذج المستقبلية، وتتم برمجتها لاستبعاد المصادر التي تتطلب الوصول إلى نظام حظر الاشتراك غير المدفوع، أو المعروف عنها أنها تجمع معلومات التعريف الشخصية (PII)، أو التي تحتوي على نص ينتهك سياساتنا.

وما عدا ذلك فإنّ السماح لـ GPTBot بالوصول إلى الموقع يمكن أن يساعد نماذج الذكاء الاصطناعي في أن تصبح أكثر دقة وتحسين قدراتها العامة وسلامتها.

قد تكون هذه الخطوة هي الأول من قبل OpenAI والتي قد تسمح مستقبلاً لمستخدمي الإنترنت بالانسحاب من استخدام بياناتهم لتدريب نماذج اللغة الكبيرة.

وقدم الإنترنت الكثير من بيانات التدريب لنماذج اللغات الكبيرة مثل نماذج GPT الخاصة بـ OpenAI و Google Bard.

ومع ذلك لم تؤكد شركة OpenAI ما إذا كانت قد حصلت على بياناتها من خلال منشورات وسائل التواصل الاجتماعي أو الأعمال المحمية بحقوق الطبع والنشر أو أجزاء الإنترنت التي جمعتها للحصول على معلومات.

وأصبح الحصول على البيانات من أجل التدريب على الذكاء الاصطناعي أمرًا مثيرًا للجدل بشكل متزايد.

حيث دفعت بعض المواقع بما في ذلك ريديت Reddit وتويتر Twitter، إلى اتخاذ إجراءات صارمة ضد الاستخدام المجاني لمنشورات مستخدميها من قبل شركات الذكاء الاصطناعي.

في حين رفع المؤلفون والمبدعون الآخرون دعوى قضائية بشأن الاستخدام غير المصرح به المزعوم لأعمالهم.

كما قام المشرعون أيضًا بتوجيه أسئلة حول خصوصية البيانات والموافقة في العديد من جلسات الاستماع في مجلس الشيوخ حول تنظيم الذكاء الاصطناعي الشهر الماضي.

وطرحت بعض الشركات الكبرى مثل أدوبي Adobe فكرة تمييز البيانات على أنها ليست مخصصة للتدريب من خلال قانون مكافحة انتحال الهوية.

ووقعت شركات الذكاء الاصطناعي بما في ذلك OpenAI، اتفاقية مع البيت الأبيض لتطوير نظام علامة مائية لإعلام الناس إذا كان هناك شيء ما تم إنشاؤه بواسطة الذكاء الاصطناعي، إلا أنهم لم يقدموا وعودًا بالتوقف عن استخدام بيانات الإنترنت للتدريب.

مقالات قد تعجبك

جوجل تطلق ميزة التدقيق النحوي للجُمل التي يتم البحث عنها
واتساب تختبر ميزة المكالمات الصوتية الجماعية
مايكروسوفت ستُتيح Bing Chat على المتصفحات المنافسة على الهواتف المحمولة قريباً
كيفية الحصول على أفضل الصفقات (التخفيضات) في ستيم Steam
كيفية حل مشكلة عدم عمل Face ID بشكل صحيح في آيفون
قد يعجبك ايضا

التعليقات مغلقة.

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept