ストラテゴをプレイすると、GoogleのAIが世界のトッププレーヤーの1つになります

ジャカルタ-Googleの最新の人工知能DeepMindであるDeepNashは、戦争ゲームであるStrategoでほぼすべての人間のプレイヤーを倒す方法を学びました。彼を世界のトッププレーヤーの一人にしています。

Strategoは、2人のプレイヤーが敵の旗をつかもうとするゲームです。DeepNashは、全面的な隠された場所にある対戦相手の40のゲームピースのそれぞれを把握しようとしているStrategoのプレイ方法を教えられています。

Strategoの複雑さのために、DeepNashはアルゴリズムにモデルレスなアプローチを採用しました。ここでは、AIは対戦相手の行動を正確にモデル化しようとはしていません。

この設定は、DeepNashが対戦相手の駒についてほとんど知らないゲームの初期段階で非常に役立ちます。

その後、DeepMindチームは、ゲームのバランスを見つけることを目的として、ディープ強化学習を使用してDeepNashを強化しました。ゲームの各ステップで最良の次のステップを決定するのに役立つ強化学習のように、DeepNashは全体的な学習戦略を提供します。

システムを評価するために、チームはまた、ゲームの知識を使用して、現実の世界では意味をなさない可能性のある実際のエラーを除外するように家庭教師を設計しました。

DeepMindチームによると、Strategoは不完全な情報ゲームであり、各プレーヤーが意思決定を行う際に考えられるすべての結果のバランスをとる必要があるため、DeepMind AIも以前に学習したチェス、囲碁、ポーカーよりもはるかに複雑なゲームになります。

数では、Goはポーカーやチェスよりもはるかに多い10ランク360の可能なゲームステータスを持っていますが、Strategoは10ランク535を持っています。

DeepMindチームは、DeepNashはStrategoで非常に優れているため、世界最大のオンラインStrategoプラットフォームであるGravonの人間のプレーヤーの間で史上最高のランキングのトップ3に到達したと述べています。

「ディープナッシュのプレイのレベルは私を驚かせました」と、ジャーナルScienceに掲載されたAIに関する新しい論文の著者の1人であり、元ストラテゴ世界チャンピオンでもあるヴィンセントデブールは言います。

12月6日火曜日に未来派を立ち上げたAIは、人間の対戦相手が推測し続けることを保証するための予測不可能な戦略を開発しました。

実際、AIは、低ランクの駒をはるかに価値があるかのようにプレイすることで、対戦相手をいじめる方法を学習します。

「人工的なストラテゴのプレイヤーが、経験豊富な人間のプレイヤーとの試合に勝つために必要なレベルに近づいているという話は聞いたことがありません」とBoer氏は述べています。