メタプラットフォームによる複数の言語でのスピーチの翻訳と翻訳のためのAIモデルのリリース

ジャカルタ - Facebookの親会社であるMeta Platformは、数十の言語でスピーチを翻訳して書くことができるAIモデルをリリースしました。このAIモデルは、言語の違いを横切る通信ツールのリアルタイム開発の基礎となり得ます。

ブログ記事で、同社は、約100の言語でのテキストとスピーチの間の翻訳と、35の言語の完全なスピーチからスピーチへの翻訳をサポートし、以前は別々のモデルでのみ利用可能だったテクノロジーを組み合わせたSermlessM4Tモデルを発表しました。

メタのマーク・ザッカーバーグ最高経営責任者(CEO)は、このようなツールが、同社の将来に賭ける相互接続された仮想世界であるメタバースにおける世界中のユーザー間の相互作用を促進すると想像していると述べた。Metaは、このモデルを商用目的なしに公開利用できるようにします。

世界最大のソーシャルメディア企業は、マイクロソフトが支援するOpenAIとアルファベットのGoogleが販売する高級モデルに深刻な挑戦となるLlamaと呼ばれる大手言語モデルを含む、今年はほとんど無料で多くのAIモデルをリリースしました。

ザッカーバーグ氏は、オープンなAIエコシステムはメタに利益をもたらすと述べ、同社はこれらのモデルへのアクセス料金を請求するよりも、ソーシャルプラットフォーム用の消費者向けツールの作成に貢献することでより多くの利点があります。

しかし、Metaは、モデルの作成に使用されるトレーニングデータに関して、業界全体と同様の法的問題に直面しています。

7月、コメディアンのサラ・シルバーマンと他の2人の著者は、企業が許可なく本をトレーニングデータとして使用したと主張して、メタとOpenAIに対して著作権侵害の訴訟を起こしました。

SeamlessM4Tモデルの場合、メタの研究者は、どのリポジトリが使用されているかを特定せずに、400万時間の「一般にアクセス可能なWebデータリポジトリから生のオーディオ」からオーディオトレーニングデータを収集しました。

テキストデータは、ウィキペディアや関連するウェブサイトからコンテンツを奪った昨年作成されたデータセットから来ていると、研究論文に書かれています。