Meta Luncurkan Casual Conversation V2, Kumpulan Data untuk Peneliti AI
JAKARTA - Meta ingin membantu peneliti Kecerdasan Buatan (AI) membuat alat dan proses mereka lebih inklusif secara universal, dengan merilis kumpulan data klip video tatap muka baru dan membantu pengembang menilai seberapa baik model mereka bekerja untuk kelompok demografis yang berbeda.
Basis data Meta yang dinamai Casual Conversations v2 dapat digunakan peneliti untuk mengevaluasi keadilan dan ketahanan jenis model AI tertentu dengan lebih baik.
"Kumpulan data komprehensif ini menawarkan daftar granular dari 11 kategori yang disediakan sendiri, dianotasi untuk mengukur lebih lanjut keadilan dan ketahanan algoritme dalam sistem AI ini," ungkap Meta dalam blog resminya yang dikutip Jumat, 10 Maret.
"Rilis kumpulan data ini adalah salah satu sorotan utama dari kemajuan hak-hak sipil kami, yang dibuat melalui konsultasi dengan pakar internal di bidang ini," imbuhnya.
Set data Casual Conversation v2 menyertakan 26.467 video monolog, direkam di tujuh negara, dan menampilkan 5.567 peserta berbayar, disertai data atribut ucapan, visual, dan demografis untuk mengukur keefektifan sistematis.
Baca juga:
- Waktu dan Lokasi Gerhana Matahari Hibrid di Indonesia, Bisa Dilihat Menggunakan Kamera
- Mengenal TikTok Series Beserta Harga Aksesnya, Bisa Jadi Ladang Cuan
- Ini 6 Ponsel Termurah yang Diproduksi dalam 10 Tahun Terakhir, Pilihan Pas untuk Dana Pas-Pasan
- Mengenal Istilah Tahun Cahaya: Sejarah hingga Contoh Penggunaannya
"Dengan Casual Conversations v2, kami ingin menggunakan kumpulan data multibahasa untuk mendukung pengembangan model pemrosesan bahasa alami yang inklusif," kata Meta.
Selain daftar kategori yang diperluas, Casual Conversation v2 berbeda dari versi pertama dengan penyertaan monolog peserta yang direkam di luar AS. Tujuh negara yang termasuk dalam v2 adalah Brasil, India, Indonesia, Meksiko, Vietnam, Filipina, dan AS.
Jadi data tersebut tidak mengambil informasi Facebook atau memberikan gambar dari Instagram, konten yang termasuk dalam kumpulan data ini dirancang untuk memaksimalkan inklusi dengan memberi peneliti AI lebih banyak sampel orang dari berbagai latar belakang untuk digunakan dalam model mereka.
"Di masa mendatang, kami berharap untuk memperluas kumpulan data ke geografi tambahan. Perbedaan lain dalam kumpulan data terbaru adalah peserta diberi kesempatan untuk berbicara dalam bahasa utama dan kedua," tutur Meta.