JAKARTA - Meta baru saja merilis seperangkat alat Kecerdasan Buatan (AI) generatif untuk membuat musik dan audio dari permintaan teks, yang disebut AudioCraft.
"Bayangkan seorang musisi profesional dapat mengeksplorasi komposisi baru tanpa harus memainkan satu nada pun pada instrumen," ujar Meta dalam blog resminya, dikutip Kamis, 3 Agustus.
"Atau pengembang gim indie yang mengisi dunia maya dengan efek suara realistis dan kebisingan sekitar dengan anggaran terbatas. Itulah janji AudioCraft," imbuhnya.
AudioCraft terdiri dari tiga model, mencakup AudioGen yakni alat untuk menghasilkan berbagai efek audio dan soundscapes, MusicGen yang dapat membuat komposisi musik dan melodi dari deskripsi atau teks, dan terakhir EnCodec yaitu codec kompresi audio berbasis jaringan saraf.
MusicGen sendiri dilatih pada sekitar 400.000 rekaman bersama dengan deskripsi teks dan metadata, berjumlah 20.000 jam musik yang dimiliki oleh Meta atau dilisensikan khusus untuk tujuan ini.
Menurut Meta, saat ini model AI generatif kebanyakan berpusat di sekitar teks dan gambar diam, tapi pengembangan alat audio generatif telah tertinggal.
BACA JUGA:
"Ada beberapa pekerjaan di luar sana, tetapi sangat rumit dan tidak terlalu terbuka, sehingga orang tidak dapat dengan mudah memainkannya," kata Meta.
Karenanya, Meta menciptakan AudioCraft yang memang berfungsi untuk pembuatan dan kompresi musik dan suara dalam satu atap.
Perusahaan berharap, rilis AudioCraft di bawah Lisensi MIT akan berkontribusi pada komunitas yang lebih luas dengan menyediakan alat yang dapat diakses untuk eksperimen audio dan musik.
"Dengan membagikan kode untuk AudioCraft, kami berharap peneliti lain dapat lebih mudah menguji pendekatan baru untuk membatasi atau menghilangkan potensi bias dan penyalahgunaan model generatif," jelas Meta.