Bagikan:

JAKARTA - Sebuah penelitian terbaru yang dipimpin oleh empat peneliti dari University of Tubingen Jerman dan Northwestern University telah mengungkap dampak signifikan dari penggunaan model bahasa besar (Large Language Models/LLM) terhadap tulisan ilmiah. Studi ini, yang menggunakan metode analisis kata-kata berlebih, menyoroti lonjakan penggunaan kata-kata tertentu sejak diperkenalkannya LLM pada akhir tahun 2022.

Penelitian ini dilakukan dengan menganalisis lebih dari 14 juta abstrak artikel yang dipublikasikan di PubMed antara tahun 2010 hingga 2024. Para peneliti membandingkan frekuensi relatif kata-kata sebelum dan setelah era LLM untuk mengidentifikasi perubahan dalam pilihan kosakata. Hasilnya menunjukkan bahwa sejumlah kata-kata seperti "delves," "showcasing," dan "underscores," yang sebelumnya jarang digunakan, mengalami lonjakan penggunaan yang signifikan setelah LLM menjadi lebih umum digunakan.

Dr. Andreas Müller, salah satu peneliti utama dari University of Tubingen, menjelaskan bahwa peningkatan ini mengindikasikan penggunaan LLM dalam proses penulisan abstrak ilmiah. "Kami menemukan bahwa setidaknya 10% abstrak yang dipublikasikan pada tahun 2024 menggunakan LLM dalam prosesnya," ujarnya. Temuan ini menggarisbawahi pentingnya deteksi penggunaan LLM karena meskipun teks yang dihasilkan dapat terlihat manusiawi, mereka berpotensi mengandung rujukan yang tidak akurat atau klaim palsu.

Studi ini juga membandingkan lonjakan penggunaan kata-kata pasca-LLM dengan lonjakan kata-kata selama peristiwa kesehatan dunia yang signifikan seperti pandemi COVID-19. Dr. Müller menjelaskan bahwa sebelum era LLM, lonjakan kata-kata umumnya terkait dengan peristiwa global besar seperti Ebola pada tahun 2015 dan pandemi COVID-19 dari tahun 2020 hingga 2022. Namun, lonjakan kata-kata pasca-LLM cenderung terfokus pada kata-kata gaya seperti kata kerja, kata sifat, dan kata keterangan.

Meskipun peningkatan penggunaan kata-kata ini dapat terjadi secara alami dalam evolusi bahasa, para peneliti menyoroti bahwa lonjakan yang terjadi secara tiba-tiba dan signifikan seperti ini jarang terlihat sebelum era LLM. Mereka juga mencatat bahwa penggunaan LLM mungkin lebih umum di kalangan penulis non-natif yang memerlukan bantuan dalam penyuntingan teks berbahasa Inggris.

Penemuan ini membuka jalan untuk peningkatan kemampuan manusia dalam mendeteksi dan menghapus kata-kata gaya yang tidak alami dari teks yang dihasilkan oleh LLM. Para peneliti berharap bahwa pengetahuan tentang kata-kata penanda LLM akan memungkinkan editor manusia untuk lebih efektif dalam menyaring teks generatif sebelum disebarkan ke masyarakat ilmiah global.

Studi ini telah dipublikasikan dalam bentuk prapublikasi pada awal bulan ini dan diharapkan untuk merangsang diskusi lebih lanjut tentang dampak teknologi generative AI terhadap komunikasi ilmiah modern.