シェア:

ジャカルタ-ChatGPTの背後にある会社であるOpenAIは、音声エンジンと呼ばれる新しい人工知能(AI)テクノロジーツールの小規模試験を実施していると発表しました。

「ボイスエンジンは、技術的な限界を理解し、AIで何ができるかを公然と共有するという当社のコミットメントの継続です」とOpenAIは3月31日(日)に引用された公式発表に書いています。

この音声エンジンは、まだ小規模プレビューにあるため、15秒の音声を、日本語、スペイン語、ポルトガル語、中国語、ドイツ語、フランス語などの元の音声とは異なる言語にクローンでき、音声は非常に自然に聞こえます。

We're sharing our learnings from a small-scale preview of Voice Engine, a model which uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker. https://t.co/yLsfGaVtrZ

— OpenAI (@OpenAI) March 29, 2024

We're sharing our learnings from a small-scale preview of Voice Engine, a model which uses text input and a single 15-second audio sample to generate natural-sounding speech that closely resembles the original speaker. https://t.co/yLsfGaVtrZ

音声エンジンツールは2022年後半に最初に開発され、テキストから音声へのAPI、ChatGPT音声と読書音声で利用可能な前提音声をサポートするために使用されています。

合成音声やAIによって生成された音声の誤用の可能性はたくさんありますが、OpenAIはこのツールがコミュニティによって責任を持って使用され、この新しい機能に適応できることを望んでいます。

発生する深刻なリスクを理解して、OpenAIは、このツールが安全に構築されるように、政府、メディア、エンターテイメント、教育、市民社会などのさまざまなサークルの米国および国際的なパートナーと協力していると主張しています。

「本日、ボイス エンジンをテストしているパートナーは、当社の利用方針に同意し、同意や法的権利なしに個人やその他の組織のなりすましを禁止しています」と同社は付け加えました。

最後に、OpenAIミリオンは、ボイスエンジンによって生成されたオーディオの起源を追跡するための透かしの提供や、その使用方法の積極的な監視など、一連のセキュリティ対策を実施しました。

ただし、OpenAIは、この新しいツールがいつユーザーに広くリリースされるかについては言及していません。だから、将来の次の情報を待ちましょう。


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)