Googleは、テキストから音楽を生成できる新しいAIにDALL-Eテクノロジーを導入します

ジャカルタ-テキストだけで、Googleの新しい人工知能(AI)は数分続く音楽作品を作成できます。MusicLMと呼ばれ、OpenAIの起動によるDALL-Eと同様に動作します。

それは研究論文でグーグルによって明らかにされ、13人の研究者によって書かれました。テクノメロディー、スウィング、ジャズ、瞑想音、電子音楽からデスメタル、ラップまで様々なジャンルの5分間のクリップなど、MusicLMを使用して作成された多数のサンプルが含まれています。

MusicLMは、テキストコマンドから数分の音楽を生成するだけでなく、口笛やハミングのメロディーを別の楽器に変えることができます。

彼はメロディー「ベラチャオ」を歌ったオペラティックなボーカルを生み出すことができます。その他、MusicLMは、一貫性のない歌詞と独特のアラブポップサウンドのボーカルとメロディーを持つジムプロンプトから曲を生成することもできます。

それを見ると、MusicLMシステムの動作方法は、書かれたコマンドから画像を生成するDALL-Eと非常によく似ています。残念ながら、現在、Googleは、その音楽生成AIツールを自分で試すことを誰も許可していません。

また、Googleも現時点ではモデルをリリースする予定はありません。なぜなら、研究者は、創造的なコンテンツの潜在的な誤用のリスクと、文化的虐待や盗作とも呼ばれる不実表示の可能性を懸念しているからです。

代わりに、Googleはモデルを使用して作成された多くのサンプルをアップロードしました。実際の曲のように聞こえる30秒のスニペットがありますが、明らかにそれは段落の長さの説明から作られています。

これは、ジャンル、振動、さらには特定の楽器、さらにはメロディックテクノなどの1つまたは2つの単語から作成された5分間の作品を決定するためです。

最後に、1月30日月曜日のThe Vergeから引用されたGoogleは、他の音楽ベースのAIのトレーニングと評価に役立つ約5,500の音楽とテキストのペアを含むデータセットを公開したと述べました。