Grup Hak Cipta Hentikan Dataset Bahasa Belanda yang Digunakan untuk Melatih AI
JAKARTA - Kelompok penegak hak cipta yang berbasis di Belanda, BREIN, telah berhasil menghentikan distribusi sebuah dataset bahasa besar yang sebelumnya tersedia untuk melatih model kecerdasan buatan (AI). Dataset tersebut mencakup informasi yang dikumpulkan tanpa izin dari puluhan ribu buku, situs berita, serta subtitle dalam bahasa Belanda yang diambil dari berbagai film dan serial TV.
Menurut pernyataan yang dirilis oleh BREIN pada Selasa, 13 Agustus, pengumpulan data tersebut dilakukan tanpa persetujuan dari pemilik hak cipta yang sah. Direktur BREIN, Bastiaan van Ramshorst, menyatakan bahwa meskipun belum jelas sejauh mana dataset tersebut telah digunakan oleh perusahaan AI, pihaknya berupaya untuk bertindak cepat guna menghindari tuntutan hukum di masa depan.
"Ini sangat sulit untuk diketahui, tetapi kami berusaha untuk tepat waktu," kata Van Ramshorst. Ia juga menambahkan bahwa Undang-Undang AI Uni Eropa yang akan datang akan mewajibkan perusahaan AI untuk mengungkapkan dataset yang digunakan dalam pelatihan model mereka.
Di Amerika Serikat, OpenAI yang didukung oleh Microsoft telah menghadapi beberapa tuntutan hukum, termasuk satu dari The New York Times, yang menuduh penggunaan materi berhak cipta untuk melatih model AI tanpa izin.
Baca juga:
Di Denmark, kelompok perlindungan hak cipta bernama Danish Rights Alliance sebelumnya berhasil menghentikan distribusi dataset besar lainnya yang dikenal sebagai "Books3" tahun lalu.
Orang yang menawarkan dataset bahasa Belanda tersebut telah menyetujui syarat perintah penghentian dan penarikan, serta telah menghapus dataset tersebut dari situs web tempatnya tersedia untuk diunduh, menurut BREIN. Organisasi ini tidak mengungkapkan identitas orang tersebut, mengingat aturan privasi di Belanda.
Tindakan ini menunjukkan betapa pentingnya pemantauan dan penegakan hak cipta dalam era digital, terutama terkait dengan perkembangan pesat teknologi kecerdasan buatan yang sering kali memanfaatkan data dalam jumlah besar untuk melatih modelnya.