谷歌在其新的AI中引入了DALL-E技术,可以从文本中生成音乐
雅加达 - 只需文本,谷歌的新人工智能(AI)就能够制作持续几分钟的音乐作品。它被称为MusicLM,其工作原理类似于初创公司OpenAI的DALL-E。
谷歌在一篇研究论文中透露了这一点,由13名研究人员撰写。该论文包括大量使用MusicLM创建的样本,例如技术旋律,摇摆,爵士乐,从冥想声音,电子音乐到死亡金属和说唱的各种流派的五分钟剪辑。
除了从文本命令中生成几分钟的音乐外,MusicLM 还可以将吹口哨或嗡嗡作响的旋律变成另一种乐器。
他可以用旋律“Bella Ciao”创作歌剧人声。其他,MusicLM还能够从健身房提示中制作歌曲,这些歌曲具有不连贯的歌词,人声和旋律具有独特的阿拉伯流行声音。
从表面上看,MusicLM系统的工作方式与DALL-E非常相似,DALL-E从编写的命令生成图像。不幸的是,目前谷歌不允许任何人自己尝试这种音乐生成人工智能工具。
谷歌目前也没有计划发布该模型。因为,研究人员担心潜在的滥用创意内容的风险,以及文化滥用或虚假陈述(又名抄袭)的可能性。
相反,谷歌上传了许多使用该模型生成的样本。有一个30秒的片段听起来像一首真正的歌曲,但显然它是由一段长的描述制成的。
这是为了确定流派、振动,甚至特定的乐器,以及由旋律 techno 等一两个词产生的五分钟作品。
最后,1月30日星期一,谷歌援引The Verge的话说,它已经公开发布了一个包含大约5,500个音乐文本对的数据集,这有助于训练和评估其他基于音乐的AI。