OpenAI Bagikan Cara untuk Cegah Perayap Web Akses Data Pengguna
JAKARTA - OpenAI sekarang memberi kemampuan pengguna untuk memblokir perayap web, yang bertujuan agar tidak mengorek situs untuk membantu melatih model bahasa besar (LLM) seperti GPT.
Dijuluki GPTBot, merupakan sistem yang menyisir Internet untuk melatih dan meningkatkan kemampuan Kecerdasan Buatan (AI) yang lebih besar.
Dengan menggunakan alat ini, berpotensi untuk meningkatkan model AI yang ada dalam aspek, akurasi dan keamanan.
"Halaman web yang dirayapi dengan agen pengguna GPTBot berpotensi digunakan untuk menyempurnakan model mendatang dan difilter untuk menghapus sumber yang memerlukan akses paywall," ujar OpenAI.
"Itu diketahui mengumpulkan informasi identitas pribadi (PII), atau memiliki teks yang melanggar kebijakan kami," imbuhnya.
Namun, situs web dapat memilih untuk membatasi akses ke perayap web dan mencegah GPTBot mengaksesnya, baik sebagian atau dengan menyisih seluruhnya.
"Mengizinkan GPTBot mengakses situs Anda dapat membantu model AI menjadi lebih akurat dan meningkatkan kemampuan dan keamanannya secara umum," ungkap OpenAI.
Menurut OpenAI, operator situs web dapat melarang perayap dengan memblokir alamat IP-nya atau menambahkannya ke situs dengan Robot.txt, yang pada dasarnya adalah file teks untuk menginstruksikan tentang apa yang dapat atau tidak dapat mereka akses.
Operator juga dapat menyesuaikan bagian mana yang dapat digunakan perayap web dengan mengizinkan halaman tertentu dan melarang yang lain.
Baca juga:
Melansir The Verge, Selasa, 8 Agustus, diketahui Internet menyediakan banyak data pelatihan untuk LLM seperti model GPT milik OpenAI dan Bard punya Google.
Sayangnya, OpenAI sendiri tidak mengonfirmasi apakah perusahaan mendapatkan datanya melalui unggahan media sosial, karya berhak cipta atau bagian Internet mana yang dikoreknya untuk mendapatkan informasi.