JAKARTA – Sebuah hasil studi menunjukkan bahwa chatbot Kecerdasan Buatan (AI) bisa menghasilkan respons yang lebih akurat saat pengguna bersikap kasar. Hal ini terbukti dari hasil pengujian terhadap ChatGPT.
Penelitian ini diterbitkan pada 6 Oktober 2025 di basis data pracetak arXiv. Melansir dari Live Science, para peneliti menggunakan ChatGPT-4o milik OpenAI dalam menguji apakah nada suara pengguna dapat memengaruhi kinerja sistem AI.
Peneliti mengembangkan 50 pertanyaan pilihan ganda dasar dari berbagai kategori seperti matematika dan sains. Kemudian, berbagai pertanyaan ini dibuat dalam lima kategori nada, di antaranya sangat sopan, sopan, netral, kasar, dan sangat kasar.
BACA JUGA:
Setiap pertanyaan dengan nada yang berbeda dimasukkan sebanyak sepulih kali ke dalam ChatGPT-4o. Sebelum pertanyaan diajukan, chatbot diminta untuk mengabaikan percakapan sebelumnya agar tidak terpengaruh oleh nada bicara yang sudah diajukan.
"Eksperimen kami masih dalam tahap awal dan menunjukkan bahwa nada suara dapat memengaruhi kinerja yang diukur berdasarkan skor jawaban 50 pertanyaan secara signifikan," tulis peneliti dalam makalahnya.
Pengujian pun membuktikan bahwa nada suara yang kasar 'menghasilkan respons yang lebih baik daripada nada suara yang sopan'. Akurasi responsnya mencapai 80,8 persen untuk pertanyaan yang sangat sopan dan 84,8 persen untuk pertanyaan yang sangat kasar.
Menariknya, akurasi jawaban model AI tersebut meningkat seiring dengan semakin jauhnya nada dari kategori paling sopan. Jawaban sopan memiliki tingkat akurasi 81,4 persen, diikuti oleh 82,2 persen untuk netral, dan 82,8 persen untuk nada kasar.
Namun, para peneliti menyarankan untuk tidak mengimplementasikan temuan ini. Penambahan bahasa yang menghina atau merendahkan diklaim dapat berdampak negatif pada pengalaman pengguna, aksesibilitas, dan inklusivitas.
Tim peneliti berencana memperluas penelitian mereka ke model lain, termasuk Claude LLM dari Anthropic dan ChatGPT o3 dari OpenAI. Mereka juga menyadari perlunya mengukur dimensi kinerja lain, seperti kelancaran dan koherensi di luar dari akurasi jawaban pilihan ganda.