グーグルは自分自身をプログラムできるロボットを開発します

ジャカルタ-Googleのロボット工学研究者は、自然言語の指示に基づいて独自のプログラミングコードを作成できるロボットを開発しました。ユーザーは黄色い物体を拾うなどの指示を行うだけで、残りはロボットが行います。

研究者は、GoogleのPathways言語モデル(PaLM)から開発されたコーディング固有の言語モデルであるCode as Policies(CaP)を使用して、自然言語の命令を解釈し、実行可能コードに変換しました。

ロボットは、指示と適切なコードを提供することによって訓練されます。そこから、新しい命令を取得し、API 呼び出しの順序を変更し、新しい関数を合成し、フィードバック ループを表現して新しい動作を直接収集する新しいコードを自動的に生成します。

「CaPでは、言語モデルを使用して、いくつかのコマンドを介してロボットコードを直接記述することを提案しています。私たちの実験では、コードを発行すると、ロボットのタスクを直接研究して自然言語アクションを発行するよりも、一般化とタスクのパフォーマンスが向上することが示されています」とGoogleの研究者は、11月8日火曜日の公式ブログ投稿で述べています。

「CaPを使用すると、単一のシステムで、タスク固有のトレーニングなしで、さまざまな複雑で多様なロボットタスクを実行できます」と彼は付け加えました。

つまり、一連の命令を一度提供することで、後日同様の命令に再利用できるコードを開発できます。

CaPは、特定の言語の算術演算と論理演算を使用することもできます。また、CaPは通常の言語モデルに基づいて構築されているため、絵文字や英語以外の言語の理解など、コードとは関係のない機能がいくつかあります。

この研究は非常に興味深いものであり、ロボットは訓練されたもの以外のタスクを実行することが悪名高いほど困難です。たとえば、卓球をするようにロボットをプログラミングしても、野球やテニスなどの他のゲームをプレイすることはできません。

CaPはまだ普及している実際のアプリケーションにはほど遠いですが、ロボットは特別なトレーニングなしでさまざまな複雑なロボットタスクを実行できます。