العب Stratego ، أصبح الذكاء الاصطناعي Google أحد أفضل اللاعبين في العالم
ديبناش يلعب ستراتيغو (الصورة: وثيقة. جوجل ديب مايند)

أنشرها:

جاكرتا - تعلم أحدث ذكاء اصطناعي من Google DeepMind ، DeepNash كيفية هزيمة جميع اللاعبين البشريين تقريبا في لعبة الحرب ، Stratego. مما يجعله أحد أفضل اللاعبين في العالم.

Stratego هي لعبة تتضمن لاعبين يحاولان الاستيلاء على علم العدو. يتم تعليم DeepNash كيفية لعب Stratego ، الذي يحاول معرفة كل قطعة من قطع لعبة خصمه البالغ عددها 40 قطعة الموجودة في مواقع مخفية في جميع المجالات.

بسبب تعقيد Stratego ، اتبعت DeepNash نهجا بلا نموذج لخوارزمياتها. هنا ، لا تحاول الذكاء الاصطناعي نمذجة سلوك خصمها بالضبط ، وهو نوع من القائمة الفارغة للتعلم.

هذا الإعداد مفيد جدا في المراحل الأولى من اللعبة ، عندما يعرف DeepNash القليل جدا عن قطع خصمه ، فإنه يجعل التنبؤات صعبة للغاية.

ثم استخدم فريق DeepMind التعلم المعزز العميق لتشغيل DeepNash ، بهدف إيجاد توازن اللعبة. مثل التعلم المعزز الذي يساعد في تحديد أفضل خطوة تالية في كل خطوة من خطوات اللعبة ، بينما يوفر DeepNash استراتيجية تعلم شاملة.

لتقييم النظام ، قام الفريق أيضا بتصميم مدرسين لاستخدام المعرفة من اللعبة لتصفية الأخطاء الحقيقية التي قد لا تكون منطقية في العالم الحقيقي.

وفقا لفريق DeepMind ، فإن Stratego هي لعبة معلومات غير كاملة وتتطلب من كل لاعب موازنة جميع النتائج المحتملة عند اتخاذ القرارات ، مما يجعلها لعبة أكثر تعقيدا من لعبة الشطرنج أو Go أو البوكر ، والتي تعلمها DeepMind الذكاء الاصطناعي أيضا من قبل.

بالأرقام ، لدى Go عشر رتب 360 حالة لعبة محتملة ، أكثر بكثير من لعبة البوكر أو الشطرنج بينما لدى Stratego عشر رتب 535.

صرح فريق DeepMind ، أن DeepNash أصبحت جيدة جدا في Stratego لدرجة أنها وصلت إلى المراكز الثلاثة الأولى على الإطلاق بين اللاعبين البشريين على أكبر منصة Stratego عبر الإنترنت في العالم ، Gravon.

"لقد فاجأني مستوى لعب DeepNash" ، كما يقول أحد مؤلفي ورقة جديدة عن الذكاء الاصطناعي نشرت في مجلة Science ، فنسنت دي بوير ، وهو أيضا بطل العالم السابق في Stratego.

عند إطلاق Futurism ، الثلاثاء 6 ديسمبر ، طورت الذكاء الاصطناعي استراتيجية لا يمكن التنبؤ بها لضمان استمرار خصومها البشريين في التخمين ، والتي تتضمن نشر الطعوم لإبعادهم عن المسار الصحيح.

في الواقع ، يتعلم الذكاء الاصطناعي كيفية التنمر على خصومه من خلال لعب قطعة منخفضة المستوى كما لو كانت أكثر قيمة.

قال بوير: "لم أسمع أبدا عن لاعب Stratego مصطنع يقترب من المستوى المطلوب للفوز بمباراة ضد لاعب بشري متمرس".


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)