メタが他のAIワークを評価できるAIモデルを発表

ジャカルタ - Facebookの親会社であるMetaは、10月18日(金)に研究部門から「自走評価者」と呼ばれるモデルを含む、多くの新しい人工知能(AI)モデルのリリースを発表しました。このモデルは、AI開発プロセスへの人間の関与を減らす可能性を秘めています。

この発表は、メタが8月に発表した論文でツールの導入に続くもので、このモデルが最近のOpenAIモデルで使用されたものに似た「思考の連鎖」技術を使用して、他のAIモデルの結果をより信頼できる評価を行う方法を説明しています。この手法は複雑な問題をより小さな論理的なステップに分解し、科学、プログラミング、数学などの分野における回答の精度を向上させます。

興味深いことに、この評価モデルは、AIによって生成されたデータを使用して、トレーニングプロセス中に人間の関与なしに完全にトレーニングされています。

このプロジェクトの背後にいる2人のメタ研究者は、AIが他のAIワークを信頼的に評価する能力は、独自のエラーから学ぶことができる自律型AIエージェントを作成する機会を開くと述べています。このようなエージェントは、AI業界の多くの関係者によって、人間の介入なしにさまざまなタスクを完了できるインテリジェントなデジタルアシスタントと見なされています。

「うまくいけば、AIがますます『スーパーヒューマン』に発展するにつれて、AIは平均的な人間よりもさらに優れた、それ自身の仕事の結果を調べる上でより良くなるでしょう」とMetaの研究者の一人であるJason Westonは述べています。

修復可能なAIモデルは、現在、特別なスキルを持つ人間の解剖者からの入力を必要としている、人間のフィードバックからの強化学習などの高価で非効率的なプロセスを置き換えることもできます。

メタに加えて、GoogleやAnthropicなどの他の企業もRLAIF(AIフィードバックからの再強化学習)コンセプトに関連する研究を発表していますが、メタは一般の人々が使用するためのモデルをリリースすることで、よりオープンです。

「自作評価者」に加えて、メタは金曜日に「セグメント・アニバン」画像識別モデル、大言語モデル(LLM)の応答時間を短縮するツール、新しい無機物の発見に役立つデータセットの更新など、いくつかのAIツールもリリースしました。