メタが未記述言語向けのAI翻訳者を開発

ジャカルタ - メタはユニバーサルスピーチトランスレータシステムを開発しており、将来的には何百もの言語をリアルタイムで翻訳する人工知能を訓練することが期待されています。

この技術大手は、タウィアン全土で話されているが書かれていない言語であるHokkienを翻訳する最初の人工知能を生み出したと主張している。

「この翻訳システムは、Meta AIのユニバーサルスピーチトランスレータプロジェクトの最初のマイルストーンであり、話し言葉を含むすべての言語でリアルタイムの音声から音声への翻訳を提供するAIシステムの開発に焦点を当てています」とMetaは声明で述べています。

メタ人工知能プロジェクトの目的は、メタバースの住民が簡単に交流できるようにするだけでなく、正式な書記体系を持たないより多くの言語を翻訳することです。

マーク・ザッカーバーグが所有する会社によると、世界で知られている約7,000の言語のほぼ半分があり、そのうちの4つは付随する書かれたコンポーネントなしで存在します。

これらの未記述言語は、通常、新しい言語に翻訳してテキストを音声に戻す前に、口頭の音声を書かれた単語に変換する必要があるため、現代の機械学習翻訳システムにとってユニークな問題を引き起こします。

「(これを回避するために)音声からユニットへの変換(S2UT)を使用して、入力音声をMetaによって以前に開拓されたパスで音響ユニットのシーケンスに直接変換しました」とザッカーバーグはEngadget、10月20日木曜日から引用したと説明しました。

「次に、ユニットから波形を生成します。さらに、ユニットは、最初の行デコーダが対応する言語(中国語)でテキストを生成し、2行目のデコーダがユニットを作成するコードデコードメカニズムに2回採用されました」と彼は付け加えました。

人工知能は一度に1文しか翻訳できないため、現在Hokkienの翻訳者はまだ進行中ですが、他の研究者が開発できるようにオープンソースとしてすでにリリースされています。

さらに、同社はまた、メタの革新的な自然言語処理ツールを通じて開発された音声から音声への翻訳の大規模なコレクションであるSpeechMatrixをリリースしました。