العب Stratego ، أصبح الذكاء الاصطناعي Google أحد أفضل اللاعبين في العالم

جاكرتا - تعلم أحدث ذكاء اصطناعي من Google DeepMind ، DeepNash كيفية هزيمة جميع اللاعبين البشريين تقريبا في لعبة الحرب ، Stratego. مما يجعله أحد أفضل اللاعبين في العالم.

Stratego هي لعبة تتضمن لاعبين يحاولان الاستيلاء على علم العدو. يتم تعليم DeepNash كيفية لعب Stratego ، الذي يحاول معرفة كل قطعة من قطع لعبة خصمه البالغ عددها 40 قطعة الموجودة في مواقع مخفية في جميع المجالات.

بسبب تعقيد Stratego ، اتبعت DeepNash نهجا بلا نموذج لخوارزمياتها. هنا ، لا تحاول الذكاء الاصطناعي نمذجة سلوك خصمها بالضبط ، وهو نوع من القائمة الفارغة للتعلم.

هذا الإعداد مفيد جدا في المراحل الأولى من اللعبة ، عندما يعرف DeepNash القليل جدا عن قطع خصمه ، فإنه يجعل التنبؤات صعبة للغاية.

ثم استخدم فريق DeepMind التعلم المعزز العميق لتشغيل DeepNash ، بهدف إيجاد توازن اللعبة. مثل التعلم المعزز الذي يساعد في تحديد أفضل خطوة تالية في كل خطوة من خطوات اللعبة ، بينما يوفر DeepNash استراتيجية تعلم شاملة.

لتقييم النظام ، قام الفريق أيضا بتصميم مدرسين لاستخدام المعرفة من اللعبة لتصفية الأخطاء الحقيقية التي قد لا تكون منطقية في العالم الحقيقي.

وفقا لفريق DeepMind ، فإن Stratego هي لعبة معلومات غير كاملة وتتطلب من كل لاعب موازنة جميع النتائج المحتملة عند اتخاذ القرارات ، مما يجعلها لعبة أكثر تعقيدا من لعبة الشطرنج أو Go أو البوكر ، والتي تعلمها DeepMind الذكاء الاصطناعي أيضا من قبل.

بالأرقام ، لدى Go عشر رتب 360 حالة لعبة محتملة ، أكثر بكثير من لعبة البوكر أو الشطرنج بينما لدى Stratego عشر رتب 535.

صرح فريق DeepMind ، أن DeepNash أصبحت جيدة جدا في Stratego لدرجة أنها وصلت إلى المراكز الثلاثة الأولى على الإطلاق بين اللاعبين البشريين على أكبر منصة Stratego عبر الإنترنت في العالم ، Gravon.

"لقد فاجأني مستوى لعب DeepNash" ، كما يقول أحد مؤلفي ورقة جديدة عن الذكاء الاصطناعي نشرت في مجلة Science ، فنسنت دي بوير ، وهو أيضا بطل العالم السابق في Stratego.

عند إطلاق Futurism ، الثلاثاء 6 ديسمبر ، طورت الذكاء الاصطناعي استراتيجية لا يمكن التنبؤ بها لضمان استمرار خصومها البشريين في التخمين ، والتي تتضمن نشر الطعوم لإبعادهم عن المسار الصحيح.

في الواقع ، يتعلم الذكاء الاصطناعي كيفية التنمر على خصومه من خلال لعب قطعة منخفضة المستوى كما لو كانت أكثر قيمة.

قال بوير: "لم أسمع أبدا عن لاعب Stratego مصطنع يقترب من المستوى المطلوب للفوز بمباراة ضد لاعب بشري متمرس".