OpenAIは「スターベリー」コードネームで新しい配信技術を開発

ジャカルタ-ChatGPTメーカーのOpenAIは、コードネーム「スターベリー」というプロジェクトで人工知能モデルへの新しいアプローチを開発しています。これは、この問題と内部文書に精通している人々からの情報に基づいて明らかにされました。以前に報告されたことのないこのプロジェクトは、Microsoftが支援するスタートアップが、提供するタイプのモデルが高度な報復機能を提供できることを示すために競い合っているときに行われます。

OpenAI内のチームは、5月にロイターが見たOpenAIの内部文書のコピーによると、ストローベリーで働いています。残念なことに、OpenAIがストローベリーを使用して研究を行う計画を詳述している文書の正確な日付はまだわかりません。情報筋は、この計画を進行中の仕事と表現しています。残念なことに、今まで、ストローベリーが一般に発売されるのにどれほど近いかは不明です。

ストローベリーの仕組みは、OpenAIの内部でさえも厳密に秘密にされている、と情報筋は述べた。この文書は、企業のAIが質問に対する答えを生み出すだけでなく、OpenAIが「ディープラサーチ」と呼ぶものを行うためにインターネットを独立して信頼できる方法でナビゲートすることを可能にすることを目的として、ストローベリーモデルを使用するプロジェクトについて説明しています。12人以上のAI研究者とのインタビューによると、AIモデルではこれまで達成が困難でした。

OpenAIの広報担当者は声明で、「AIモデルには、私たちの仕事よりも世界を見て理解してもらいたいのです。新しいAI機能の継続的な研究は、これらのシステムが時間の経過とともに推論において改善されるという共通の信念を持って、業界では一般的な慣行です。

ストローベリーのプロジェクトは、以前は第1四半期として知られていましたが、昨年のロイターのレポートによると、すでに同社内のブレークスルーと見なされていました。2人の情報源は、今年初めのQ*デモが、現在の商業モデルの範囲を超えた複雑な科学数学の質問に答えることができたと説明しました。

ブルームバーグの報道によると、7月9日火曜日、OpenAIは人間のような新しい penal作スキルを備えていると主張する研究プロジェクトのデモンストレーションを発表した。OpenAIの広報担当者は会議を確認したが、内容の詳細を提供することを拒否した。しかし、メディアは実証されたプロジェクトがストローベリーであるかどうかを判断できなかった。

OpenAIは、このイノベーションがAIモデルのペナルティ能力を劇的に改善することを望んでいると、このことを知っている情報源は語った。彼はまた、ストローベリーは、これまで膨大なデータセットについて訓練された後、AIモデルを処理する特別な方法を含むと付け加えた。

研究者らは、推論はAIが人間または超人間レベルの知性を達成するための鍵であると言います。大規模な言語モデル(LLM)は、すでに固体テキストを要約し、エレガントな散文を人間よりも速く編集することができます。しかし、このテクノロジーは、論理的なエラーを認識したり、ティックタックを演奏したりするなど、解決策が人々にとって直感的に見える常識の問題で失敗することがよくあります。

ストローベリーは、これらの課題に対処するOpenAIの計画の重要な要素であると、この問題に精通している情報源は語った。ロイターが見た文書は、ストローベリーが何を達成しようとしているかを示していますが、その方法はありません。

ここ数ヶ月、同社は個人的に開発者や他の部外者に、会社のプレゼンテーションを聞いた4人の人物によると、より高度なペナルティ機能を備えたテクノロジーをほぼリリースしていることを示唆している。彼らは個人的な問題について話すことを許されなかったので、特定されることを拒否しました。

ストローベリーは、OpenAIジェネレーティブAIモデルの「ポストトレーニング」として知られるものの具体的な方法であるか、大量の一般的なデータに「ブラッシング」された後、特殊な方法でパフォーマンスを向上させるために基本的なモデルを調整する方法です。

ストローベリーは、2022年にスタンフォードで開発された「自閉症解像度」または「STaR」と呼ばれる方法と類似点があると、この問題に精通している情報源は述べています。STaRにより、AIモデルは、独自のトレーニングデータを作成する際により、より高いレベルの知性に自分自身を「ブートストラップ」することができます。

OpenAIがStrawberryで目指す機能の1つは、将来の計画と拡張期間中に一連の行動を実行するためのモデルを必要とする複雑なタスクを指す、長期タスク(LHT)を実行することです、と最初の情報源は説明しました。

そのために、OpenAIの内部文書によると、OpenAIは同社が「詳細な研究」データセットと呼ぶもののモデルを作成、訓練、評価しています。ロイター通信は、データセットに何があるのか、または期間がどれくらいの期間延長されたのかを判断できなかった。

OpenAIは特に、文書と情報源の1つによると、調査結果に基づいて行動を起こすことができる「CUA」またはコンピュータユーザーエージェントの助けを借りて、ウェブを独立してサーフィンして研究を行うためにこの機能を使用することをモデルに望んでいます。OpenAIはまた、ソフトウェアエンジニアや機械学習の仕事を遂行する能力をテストする予定です。