Bagikan:

JAKARTA - Tidak ingin tertinggal dari Google, Meta meluncurkan model bahasa pembelajaran mendalam sumber terbuka berbasis Kecerdasan Buatan (AI), MusicGen.

Bulan lalu, Google merilis generator musik serupa bernama MusicLM, tetapi MusicGen tampaknya memberikan hasil yang sedikit lebih baik.

Dikembangkan oleh tim Audiocraft di Meta, MusicGen seperti versi musik dari ChatGPT yang dapat menghasilkan musik baru berdasarkan permintaan teks dan bisa diselaraskan dengan lagu yang sudah ada.

Pengguna tinggal memasukkan deskripsi teks singkat tentang jenis musik yang ingin didengar dan dalam waktu singkat, AI akan membuat trek sepanjang 12 detik sesuai dengan instruksi.

Misalnya, seseorang dapat memberi tahu MusicGen untuk menghasilkan lagu "lofi slow BPM electro chill dengan sampel organik", dan hasil audionya terdengar seperti sesuatu yang biasa didengar di radio YouTube Lofi Girl.

Meta menyatakan, tim Audiocraft menggunakan 20.000 jam musik berlisensi untuk pelatihan, termasuk 10.000 trek berkualitas tinggi dari kumpulan data internal, bersama dengan trek Shutterstock dan Pond5.

Untuk membuatnya lebih cepat, mereka menggunakan tokenizer audio 32Khz EnCodec perusahaan untuk menghasilkan potongan musik lebih kecil yang dapat diproses secara paralel.

Namun, tidak seperti MusicLM, MusicGen tidak dapat melakukan vokal, hanya instrumental. Saat ini, model AI Meta baru tersedia secara gratis di situs web Hugging Face, seperti dikutip dari Engadget, Selasa, 13 Juni.

"Tidak seperti metode yang ada seperti MusicLM (Google), MusicGen tidak memerlukan representasi semantik yang diawasi sendiri (dan) hanya memiliki 50 langkah regresi otomatis per detik audio," tweet Insinyur Hugging Face ML, Ahsen Khaliq.