OpenAIがAI音声アシスタントの開発を加速するための新しいツールを導入

ジャカルタ - マイクロソフトが支援する人工知能企業OpenAIは、開発者がAIベースのアプリケーションを簡単に構築できるようにするため設計された一連の新しいツールを9月1日火曜日に発表しました。この動きは、ますます洗練された生成AI技術を開発しているGoogleやAlphabetなどのテクノロジー大手との競争が激化する中で行われます。

導入された新しいツールの1つは、開発者がAI音声アプリケーションをより簡単に作成できるリアルタイムシステムです。このツールを使用すると、開発者は、以前は少なくとも3つの別々のステップが必要だったアプリケーションを作成するために、一連の指示を使用するだけで済みます:まず、音声を書き起こし、次にテキストモデルを実行して質問に対する答えを提供し、最後にテキストを音声に変換するテキストから音声へのモデルを実行します。この簡素化されたプロセスにより、開発時間が短縮され、音声AIテクノロジーを活用しようとする企業のコストが削減されます。

OpenAIはAI業界の主要プレーヤーの1つとなっており、収益の大部分は企業サービスを使用して独自のAIアプリケーションを構築する企業から来ています。OpenAIは、この高度な機能を導入することで、競争の激しい市場での地位をさらに強化したいと考えています。

ジェネレーティブAI業界での競争は、ビデオ、オーディオ、テキストなどのさまざまな形態の情報を処理するためにAIモデルを統合するGoogleなどの他のハイテク巨人の努力に沿って激化しています。これにより、OpenAIは革新を続け、開発者により効率的なソリューションを提示するというプレッシャーにさらされます。

ロイター通信は、OpenAIが2025年までに収益を最大116億米ドル(177.3兆ルピア)に増やすと予想されており、2024年の推定37億米ドル(56.5兆ルピア)から大幅に増加していると報じた。さらに、同社はまた、65億米ドル(99.3兆ルピア)相当の資金調達の真っ只中にあり、評価額を最大1500億米ドル(2兆ドル)に引き上げる可能性があります。

ファインタウンとプロンプトコーチング機能

この新しいツールの発売の一環として、OpenAIは、開発者が画像とテキストに基づいてAIモデルによって生成された応答を微調整できる微調整機能も導入しました。これらのファインタウンには、人間からのフィードバックが含まれ、モデルに良い反応と悪い反応の例を提供するため、AIはより関連性のある正確な答えを提供することを学ぶことができます。

画像を使用してモデルを微調整することで、AIはより優れた視覚的理解を得ることができ、より高度な視覚検索や自動運転車でのより正確な物体検出など、さまざまなアプリケーションで使用できます。

さらに、OpenAIは開発コストを半分に削減できる「プロンプトキャッシング」ツールも立ち上げました。このツールを使用すると、開発者は AI によって以前に処理されたテキスト部分を再利用できるため、アプリケーション作成プロセスがより効率的になります。

AI技術の急速な発展の中で、規制とそのユーザーのプライバシーとセキュリティへの影響に関する懸念があります。OpenAIやその他のテクノロジー企業は、特にAIモデルの運用におけるデータの使用と透明性の点で、ますます厳しくなる規制に適応する必要があります。

それにもかかわらず、OpenAIは、その革新が、ますます洗練され、ユーザーに優しい音声アプリケーションの開発を含む、さまざまな分野でAIテクノロジーの進歩を促進し続けると楽観視しています。

新しいツールが発売されたことで、OpenAIは、生成AI技術競争のトップに位置を維持しながら、世界中の開発者により高速で効率的でアクセスしやすいAIソリューションを提供し続けることを望んでいます。