Meta Luncurkan Model AI yang Dapat Mengevaluasi Kerja AI Lainnya

JAKARTA – Meta, perusahaan induk Facebook, mengumumkan perilisan sejumlah model kecerdasan buatan (AI) terbaru dari divisi risetnya pada  Jumat, 18 Oktober, termasuk sebuah model bernama "Self-Taught Evaluator." Model ini menawarkan potensi untuk mengurangi keterlibatan manusia dalam proses pengembangan AI.

Pengumuman ini mengikuti pengenalan alat tersebut dalam makalah yang diterbitkan Meta pada Agustus, yang menjelaskan bagaimana model ini menggunakan teknik "chain of thought," serupa dengan yang digunakan dalam model OpenAI baru-baru ini, untuk membuat penilaian yang lebih andal terhadap hasil dari model AI lainnya. Teknik ini memecah masalah kompleks menjadi langkah-langkah logis yang lebih kecil, meningkatkan akurasi jawaban dalam bidang-bidang seperti ilmu pengetahuan, pemrograman, dan matematika.

Yang menarik, model evaluator ini dilatih sepenuhnya menggunakan data yang dihasilkan oleh AI, tanpa keterlibatan manusia selama proses pelatihan.

Dua peneliti Meta di balik proyek ini mengatakan bahwa kemampuan AI untuk mengevaluasi kerja AI lain secara andal membuka peluang untuk menciptakan agen AI otonom yang dapat belajar dari kesalahan mereka sendiri. Agen-agen semacam ini dipandang oleh banyak pihak di industri AI sebagai asisten digital yang cerdas, mampu menyelesaikan berbagai tugas tanpa campur tangan manusia.

"Harapannya, seiring dengan perkembangan AI yang semakin 'super-human,' AI akan semakin baik dalam memeriksa hasil kerjanya sendiri, bahkan lebih baik daripada rata-rata manusia," ujar Jason Weston, salah satu peneliti Meta.

Model-model AI yang dapat memperbaiki dirinya sendiri juga dapat menggantikan proses yang mahal dan tidak efisien seperti Reinforcement Learning from Human Feedback, yang saat ini memerlukan input dari pengannotator manusia yang memiliki keahlian khusus.

Selain Meta, perusahaan lain seperti Google dan Anthropic juga telah mempublikasikan penelitian terkait konsep RLAIF (Reinforcement Learning from AI Feedback), namun Meta lebih terbuka dengan merilis model-modelnya untuk digunakan oleh publik.

Selain "Self-Taught Evaluator," Meta juga merilis beberapa alat AI lainnya pada  Jumat, termasuk pembaruan untuk model identifikasi gambar "Segment Anything," alat yang mempercepat waktu respons model bahasa besar (LLM), serta dataset yang dapat membantu dalam penemuan bahan anorganik baru.