Google lance Lyria 3 sur Gemini, qui peut créer une chanson de 30 secondes avec des commandes de texte et des images
JAKARTA - Google a lancé une nouvelle fonction de musique sur Gemini à travers le Lyria 3, un modèle de musique generative IA, qui permet aux utilisateurs de composer une chanson de 30 secondes avec seulement une commande texte ou un chargement de photos et de vid́os.
Lancé aujourd'hui en version bêta, Lyria 3 est une nouvelle étape de Google dans l'expansion des expressions créatives basées sur l'intelligence artificielle (IA), après avoir développé auparavant la capacité de réaliser des images et des vid́os dans l'application Gemini.
Avec Lyria 3, vous n’avez qu’à décrire l’idée de la chanson souhaitée, par exemple le genre, l’humeur, le tempo, le style vocal. Le système génère alors automatiquement une musique complète avec des paroles en quelques secondes.
« Il suffit de décrire une idée ou de télécharger une photo, comme « une chanson R&B slow jam drôle sur des chaussettes qui trouvent leur partenaire » et en quelques secondes, Gemini la traduira en une chanson de haute qualité et attrayante », a écrit l’entreprise dans son annonce.
En plus des commandes textuelles, Gemini peut également transformer une photo ou une vidéo en une chanson. Par exemple, téléchargez une photo de vacances ou de votre animal de compagnie, puis demandez à Gemini de créer une chanson qui correspond à l’ambiance visuelle.
Google indique que Lyria 3 présente trois améliorations majeures par rapport au modèle précédent, à savoir la création de paroles automatiques, un contrôle plus large des éléments musicaux tels que le style et le tempo, ainsi qu'une qualité audio plus réaliste et complexe.
Chaque chanson produite dure 30 secondes et est accompagnée d’une couverture automatique créée à l’aide du modèle Nano Banana. Les résultats peuvent être téléchargés ou partagés via un lien direct.
« L’objectif de cette piste n’est pas de créer une œuvre musicale majeure, mais de vous donner un moyen amusant et unique d’exprimer vous-même », a affirmé le géant des recherches.
Google a également affirmé que toute l’audio produite serait marquée par SynthID, une marque d’eau invisible développée par Google pour marquer le contenu créé par l’IA.
La fonction de création de musique avec Lyria 3 est disponible pour les utilisateurs de 18 ans et plus dans un certain nombre de langues, dont l’anglais, l’allemand, l’espagnol, le français, l’hindi, le japonais, le coréen et le portugais.
Le lancement a été fait en premier pour la version de bureau et sera suivi par une application mobile dans les jours qui suivront. Les clients Google AI Plus, Pro et Ultra obtiendront des limites d’utilisation plus hautes.