العب Stratego ، أصبح الذكاء الاصطناعي Google أحد أفضل اللاعبين في العالم
جاكرتا - تعلم أحدث ذكاء اصطناعي من Google DeepMind ، DeepNash كيفية هزيمة جميع اللاعبين البشريين تقريبا في لعبة الحرب ، Stratego. مما يجعله أحد أفضل اللاعبين في العالم.
Stratego هي لعبة تتضمن لاعبين يحاولان الاستيلاء على علم العدو. يتم تعليم DeepNash كيفية لعب Stratego ، الذي يحاول معرفة كل قطعة من قطع لعبة خصمه البالغ عددها 40 قطعة الموجودة في مواقع مخفية في جميع المجالات.
بسبب تعقيد Stratego ، اتبعت DeepNash نهجا بلا نموذج لخوارزمياتها. هنا ، لا تحاول الذكاء الاصطناعي نمذجة سلوك خصمها بالضبط ، وهو نوع من القائمة الفارغة للتعلم.
هذا الإعداد مفيد جدا في المراحل الأولى من اللعبة ، عندما يعرف DeepNash القليل جدا عن قطع خصمه ، فإنه يجعل التنبؤات صعبة للغاية.
ثم استخدم فريق DeepMind التعلم المعزز العميق لتشغيل DeepNash ، بهدف إيجاد توازن اللعبة. مثل التعلم المعزز الذي يساعد في تحديد أفضل خطوة تالية في كل خطوة من خطوات اللعبة ، بينما يوفر DeepNash استراتيجية تعلم شاملة.
لتقييم النظام ، قام الفريق أيضا بتصميم مدرسين لاستخدام المعرفة من اللعبة لتصفية الأخطاء الحقيقية التي قد لا تكون منطقية في العالم الحقيقي.
وفقا لفريق DeepMind ، فإن Stratego هي لعبة معلومات غير كاملة وتتطلب من كل لاعب موازنة جميع النتائج المحتملة عند اتخاذ القرارات ، مما يجعلها لعبة أكثر تعقيدا من لعبة الشطرنج أو Go أو البوكر ، والتي تعلمها DeepMind الذكاء الاصطناعي أيضا من قبل.
بالأرقام ، لدى Go عشر رتب 360 حالة لعبة محتملة ، أكثر بكثير من لعبة البوكر أو الشطرنج بينما لدى Stratego عشر رتب 535.
صرح فريق DeepMind ، أن DeepNash أصبحت جيدة جدا في Stratego لدرجة أنها وصلت إلى المراكز الثلاثة الأولى على الإطلاق بين اللاعبين البشريين على أكبر منصة Stratego عبر الإنترنت في العالم ، Gravon.
"لقد فاجأني مستوى لعب DeepNash" ، كما يقول أحد مؤلفي ورقة جديدة عن الذكاء الاصطناعي نشرت في مجلة Science ، فنسنت دي بوير ، وهو أيضا بطل العالم السابق في Stratego.
عند إطلاق Futurism ، الثلاثاء 6 ديسمبر ، طورت الذكاء الاصطناعي استراتيجية لا يمكن التنبؤ بها لضمان استمرار خصومها البشريين في التخمين ، والتي تتضمن نشر الطعوم لإبعادهم عن المسار الصحيح.
في الواقع ، يتعلم الذكاء الاصطناعي كيفية التنمر على خصومه من خلال لعب قطعة منخفضة المستوى كما لو كانت أكثر قيمة.
قال بوير: "لم أسمع أبدا عن لاعب Stratego مصطنع يقترب من المستوى المطلوب للفوز بمباراة ضد لاعب بشري متمرس".