Bagikan:

JAKARTA - Peneliti Google telah membuat AI yang dapat menghasilkan karya musik berdurasi beberapa menit dari prompt teks. Bahkan AI tersebut dapat mengubah melodi siulan atau senandung menjadi instrumen lain.

Ini mirip dengan cara sistem seperti DALL-E menghasilkan gambar dari prompt tertulis. Modelnya disebut MusicLM, dan meskipun Anda tidak bisa bermain-main dengannya sendiri, perusahaan telah mengunggah banyak sampel yang diproduksi menggunakan model tersebut.

MusicLM adalah model musik generatif dari Google yang menggunakan deep learning untuk menghasilkan musik baru. Proses ini melibatkan pelatihan model dengan data musik eksisting, seperti partitur, lagu dan audio, untuk memahami pola dan konsep dalam musik.

Setelah itu, model ini dapat membuat musik baru dengan menggabungkan pola dan konsep yang diambil dari data pelatihan. MusicLM menerima input dari pengguna seperti genre, jenis musik, dan nada dasar, dan menggunakan informasi ini untuk menghasilkan musik baru yang sesuai dengan spesifikasi pengguna.

Contohnya sangat mengesankan. Ada cuplikan 30 detik yang terdengar seperti lagu sebenarnya yang dibuat dari deskripsi sepanjang paragraf yang menentukan genre, getaran, dan bahkan instrumen tertentu, serta karya berdurasi lima menit yang dihasilkan dari satu atau dua kata seperti “melodic techno. ”

Juga ditampilkan di situs demo mereka adalah contoh dari apa yang dihasilkan model ketika diminta untuk menghasilkan klip instrumen 10 detik seperti cello atau maracas, klip delapan detik dari genre tertentu, musik yang cocok dengan pelarian dari penjara, dan bahkan seperti apa suara pemain piano pemula versus yang mahir. Ini juga mencakup interpretasi frasa seperti "klub futuristik" dan "metal kematian akordeon".

MusicLM bahkan dapat mensimulasikan vokal manusia, dan meskipun tampaknya mendapatkan nada dan suara secara keseluruhan dengan benar, ada kualitas yang pasti salah. Cara terbaik yang bisa digambarkan adalah suaranya kasar atau statis.

Musik yang dihasilkan AI memiliki sejarah panjang sejak beberapa dekade yang lalu. Ada sistem yang telah dikreditkan dengan membuat lagu-lagu pop, meniru Bach lebih baik daripada yang bisa dilakukan manusia di tahun 90-an, dan mengiringi pertunjukan langsung.

Satu versi terbaru menggunakan mesin pembuat gambar AI StableDiffusion untuk mengubah perintah teks menjadi spektogram yang kemudian diubah menjadi musik. Makalah tersebut mengatakan bahwa MusicLM dapat mengungguli sistem lain dalam hal "kualitas dan kepatuhan pada teks", serta fakta bahwa ia dapat menerima audio dan menyalin melodi.

Bagian terakhir itu mungkin salah satu demo paling keren yang dikeluarkan para peneliti. Situs ini memungkinkan Anda memutar audio input, di mana seseorang menyenandungkan atau menyiulkan sebuah lagu, lalu memungkinkan Anda mendengar bagaimana model mereproduksinya sebagai lead synth elektronik, kuartet senar, solo gitar, dll..

Seperti upaya lain dalam jenis AI ini, Google secara signifikan lebih berhati-hati dengan MusicLM daripada beberapa rekannya dengan teknologi serupa. “Kami tidak memiliki rencana untuk merilis model pada saat ini,” ungkap makalah tersebut, dikutip The Verge. Hal ini menimbulkan risiko “potensi penyalahgunaan konten kreatif” atau plagiarisme dan potensi perampasan budaya atau misrepresentasi.

Selalu ada kemungkinan teknologi dapat muncul di salah satu eksperimen musik Google yang menyenangkan di beberapa titik, tetapi untuk saat ini, satu-satunya orang yang dapat memanfaatkan penelitian ini adalah orang lain yang membangun sistem AI musik.

Google mengatakan secara terbuka merilis kumpulan data dengan sekitar 5.500 pasangan musik-teks, yang dapat membantu saat melatih dan mengevaluasi AI musik lainnya.