Google DeepMindがロボットを開発するための3つの高度なモデルを作成

ジャカルタ - アルファベットの人工知能(AI)会社であるGoogle DeepMindは、ロボット工学の世界で新たな進歩を遂げています。彼らはロボットの初期基盤として3つのシステムを構築しました。

ロボットトランスフォーマー(RT)モデルに基づいて彼らが作成したシステムは、オートRT、SARA-RT、RTトレイクトリーでした。これら3つのシステムは、ロボットが意思決定を下すときと環境をナビゲートするときの両方で、より速く機能できると考えられています。

AutoRTは、大きな基盤モデルの可能性を利用するシステムです。このシステムは、大型言語モデル (LLM) やロボット制御モデル (RT-1、RT-2) などの大型基本モデルを組み合わせるため、ロボットにとって重要なコンポーネントと呼ばれています。

AutoRTを使用することで、ロボット開発者はロボット学習を改善し、複数のロボットのコントロールを同時にトレーニングすることができます。このシステムは、ロボットにさまざまな設定でさまざまなタスクを実行するように指示することができます。

「このシステムは、20台のロボットを同時に安全に設定し、さまざまなオフィスビルで合計最大52台のユニークロボットが、6,650のユニークタスクで77,000のロボット試験で構成されるさまざまなデータセットを収集します」とGoogleのロボットチームDeepMindは述べています。このモデルは、RT-2モデルと比較して10.6%正確で14%高速であると言われています。

新しいモデル改良方法であるアップトレーニングを使用するSARA-RTは、ロボットモデルをより効率的にすることができます。さらに、このネットワークアーキテクチャを使用するロボットは、ロボットをタスクに応じてより速く動作させることができます。

「私たちはシステムを使いやすくするように設計しており、SARAはトランスフォーマーを加速するための普遍的なレシピを提供しているため、多くの研究者や実践者がロボット工学などの分野で適用することを願っています」とチームは説明しました。

それほど重要ではないもう1つのモデルはRT-Trajectoryで、トレーニングビデオにおけるロボットの動きを記述するために視覚的な線を追加するモデルです。このモデルは、トレーニングデータセットを取得し、2Dトラックスケッチでコーティングします。

RGBの形でのこのトラックは、低レベルでの実用的な視覚的指示を提供します。DeepMindが実施したトライアルでは、RT-Trajectoryはロボットの性能を2倍にし、成功率は63%でした。

「RT-トラジェクトリーは、望ましいタスクについての人間のデモンストレーションを見て、手描きのスケッチを受け入れることでトラックを作成できます。そして、それはさまざまなロボットプラットフォームに簡単に適応することができます」とDeepMindロボットチームは結論付けました。