انطلقت بطولة كأس العالم لكرة القدم في روسيا في الرابع عشر من هذا الشهر، وبدأت معها الكثير من الأحاديث والتوقعات الخاصة بأداء المنتخبات المشاركة بشكل عام، وبالفائز النهائي بشكل خاص.
تعتمد بعض المواقع والشركات التي تريد البحث في مسألة توقع الفائز النهائي بهذه البطولة على الطرق والأساليب الإحصائية التقليدية التي يتم تنفيذها من قبل الإحصائيين المحترفين.
فعلى سبيل المثال توصلت بعض الأبحاث الإحصائية التي تعتمد على جمع البيانات ونمذجتها إلى أن الفريق البرازيلي هو الأكثر احتمالاً للفوز بالبطولة بنسبة 16.6%، يليه المنتخب الألماني بنسبة 12.8%.
ولكن في السنوات الأخيرة، طور الباحثون تقنيات خاصة بالذكاء الاصطناعي والتعلم الآلي، هذه التقنيات لديها القدرة على التفوق على الأساليب الإحصائية التقليدية.
من أجل ذلك قام Andreas Groll في جامعة دورتموند التقنية في ألمانيا بمشاركة عدد قليل من زملائه على توظيف هذه التقنيات الحديثة من أجل محاولة توقع الفائز.
وتم استخدام مزيجاً من تقنيات التعلم الآلي والإحصاءات التقليدية، وهي طريقة تسمى طريقة الغابة العشوائية random-forest.
ظهرت تقنية الغابة العشوائية في السنوات الأخيرة كطريقة قوية لتحليل مجموعات البيانات الكبيرة، وهي تستند إلى فكرة أن بعض الأحداث المستقبلية يمكن تحديدها من خلال شجرة القرارات التي يتم فيها حساب النتيجة في كل فرع بالرجوع إلى مجموعة من بيانات التدريب.
ومع ذلك، تعاني أشجار القرار من مشكلة معروفة جيداً، ففي المراحل الأخيرة من عملية التفرّع، يمكن أن تصبح القرارات مشوهة بشدة من خلال بيانات التدريب المتفرقة والمعرّضة للتفاوت الكبير.
استخدم Andreas Groll هذا الأسلوب لنمذجة بطولة كأس العالم الحالية، وذلك من خلال تصميم نتائج كل لعبة من المرجح أن تلعبها الفرق ومن ثم استخدام النتائج لبناء المسار الأكثر احتمالاً في البطولة.
وتم الاعتماد على مجموعة من العوامل أثناء نمذجة النتائج، بما في ذلك العوامل الاقتصادية مثل الناتج المحلي الإجمالي والسكان، وترتيب الفيفا للفرق الوطنية.
أضف إلى ذلك خواص الفرق نفسها، مثل متوسط أعمارهم، وعدد لاعبي دوري أبطال أوروبا لديهم، وجنسية المدرب وما إلى ذلك.
ومن المثير للاهتمام أن نهج الغابة العشوائية يسمح أيضاً بتضمين محاولات التصنيف الأخرى، مثل التصنيفات المستخدمة من قبل شركات الإحصاء والتنبؤ التي تعتمد على الطرق التقليدية.
تختلف التوقعات التي تم التوصل إليها من خلال هذه العملية عن غيرها من الطرق الإحصائية، كبداية تختار طريقة الغابة العشوائية إسبانيا باعتبارها الفائز الأكثر احتمالاً مع احتمال قدره 17.8%.
ومع ذلك، هناك عامل كبير في هذا التنبؤ هو هيكل البطولة نفسها، فإذا تمكنت ألمانيا من تخطي مرحلة المجموعات من المنافسة، فمن المرجح أن تواجه معارضة قوية في مرحلة خروج المغلوب اللاحقة.
تحسب طريقة الغابة العشوائية فرص ألمانيا في الوصول إلى ربع النهائي بـ 58%، على النقيض من ذلك فإنه من غير المحتمل أن تواجه إسبانيا معارضة قوية في دور خروج المغلوب، وبالتالي فإن لديها فرصة 73% للوصول إلى ربع النهائي.
قام Andreas Groll بمحاكاة كامل البطولة 100 ألف مرة، وذلك من أجل نمذجة أكبر عدد ممكن من الاحتمالات الممكنة الناتجة عن العدد الضخم من التباديل بين الفرق المشاركة.
النتيجة النهائية تقول أن إسبانيا تمتلك أفضل فرصة للفوز ببطولة كأس العالم وذلك لأن طريقها للوصول إلى النهائي أسهل من طريق ألمانيا.
ولكن إذا نجحت ألمانيا في الوصول إلى ربع النهائي، فإن نتائج محاكاة Andreas Groll تعطيها الأفضلية لتكون الفائز هذا العام وبالتالي ستتمكن من الدفاع عن لقبها الذي تم تحقيقه عام 2014.