メタは、テキストに基づいて音楽を作成できるAIツールであるAudioCraftを立ち上げました

ジャカルタ - メタは、AudioCraftと呼ばれるテキストリクエストから音楽とオーディオを作成するための一連の人工知能(AI)ツールをリリースしました。

「プロのミュージシャンが、楽器上で1つのトーンを演奏することなく、新しい構図を探求できると想像してみてください」と、メタは8月3日木曜日に引用された公式ブログで述べています。

「または、仮想世界を現実的なサウンド効果と限られた予算で周囲の騒音で満たすインディーゲーム開発者。それがAudioCraftの約束です」と彼は付け加えた。

audioCraftは、オーディオジェネレーションと音声キャップの様々な効果を生成するためのツールであるAudioGen、説明やテキストから音楽とメロディーの構成を作成できるMusicGen、そして最後に神経ネットワークベースのオーディオ圧縮コーデックであるEnCodecを含む3つのモデルで構成されています。

MusicGen自体は、テキストとメタデータの説明とともに約40万件の録音で訓練されており、メタが所有する合計20,000時間の音楽、またはこの目的のために特別にライセンスされています。

メタによると、現在、ジェネレーティブAIモデルは主に静止したテキストと画像を中心としていますが、ジェネレーティブオーディオツールの開発は遅れています。

「そこにはいくつかの仕事がありますが、それは非常に複雑で、あまりオープンではないので、人々は簡単にそれをプレイすることはできません」とMetaは言いました。

そこでメタは、音楽やサウンドを1つの屋根で作り、表現するのに役立つオーディオクラフトを作成しました。

同社は、MITライセンスの下でのAudioCraftのリリースが、オーディオおよび音楽実験のためのアクセス可能なツールを提供することにより、より広いコミュニティに貢献することを期待しています。

「AudioCraftのコードを共有することで、他の研究者が潜在的な偏見や生成モデルの誤用を制限または排除するための新しいアプローチをより簡単にテストできることを願っています」とMeta氏は説明します。