BRIN, KORIKA, GDP Venture, dan AI Singapore Kembangkan LLM Bahasa Indonesia Lewat Platform SEA-LION

 

JAKARTA – Badan Riset dan Inovasi Nasional (BRIN), Kolaborasi Riset dan Inovasi Kecerdasan Buatan (KORIKA), dan dua portofolio dari GDP Venture, yaitu Glair.ai dan Datasaur.ai, bekerja sama dalam membangun Large Language Model (LLM) Bahasa Indonesia.

LLM ini akan dihadirkan melalui platform SEA-LION buatan AI Singapore. Harapannya, platform ini bisa dimanfaatkan oleh banyak pihak sehingga teknologi dan penerapan ilmu pengetahuan dalam bahasa Indonesia bisa semakin maju.

Kepala Strategi, Kemitraan, dan Pertumbuhan AI Singapore Darius Liu mengatakan bahwa AI generatif seperti GPT memang sudah tersedia di hampir seluruh negara, tetapi kemampuan bahasanya hanya unggul di wilayah bagian Barat seperti bahasa Inggris.

“Kita harus bekerja sama untuk memecahkan masalah ini sekarang. AI Singapore telah menyiapkan program LLM untuk mencapai tiga hal untuk melatih keluarga LLM kecil yang berfokus di Asia Tenggara secara khusus,” kata Darius saat mengumumkan kerja sama lima lembaga pada Kamis, 30 November.

Dengan kendala ini, AI Singapore berusaha mengembangkan LLM bahasa Indonesia ke platform mereka. Meski masih dalam tahap pembangunan, SEA-LION sudah diuji beberapa kali dan dibandingkan dengan dua chatbot besar seperti GPT-4 dan Llama 2.

Dari hasil pengujian AI Singapore, SEA-LION berulang kali memberikan respons yang lebih baik saat menggunakan bahasa Indonesia dibandingkan dengan GPT dan Llama. Baik pertanyaan sederhana seperti apa itu gotong royong hingga analisis sentimen.

Meski ketiga platform chatbot ini sudah dibandingkan, AI Singapore belum bisa menyebutkan seberapa tinggi tingkat akurasi SEA-LION jika dibandingkan dengan GPT dan Llama. Namun, perusahaan sudah mengantongi jumlah persentasenya.

Nanti kita akan publish beberapa hari lagi perbandingan SEA-LION berapa persen, Llama berapa persen,” ujar Kepala Kecerdasan Buatan AI Singapore William Tjhi ketika ditanya oleh VOI.

William juga menjelaskan bahwa benchmark dalam bahasa Inggris sangat mudah untuk dibuat, tetapi berbeda untuk bahasa di wilayah Asia Tenggara. Maka dari itu, AI Singapore harus membuat benchmark-nya secara khusus dari awal.

Sementara itu, ketika ditanya mengenai keamanannya, William mengatakan bahwa hal tersebut menjadi fokus utama mereka selain mengembangkan platformnya. Namun, keamanan dari platform ini perlu kerja sama dari seluruh lembaga, termasuk BRIN dan KORIKA.

“Niatnya akan bisa diakses dengan masyarakat luas karena ini kan open source, ya. Cuma, kita sebagai pengembang harus bisa responsible. Kita harus make sure bahwa ini LLM tidak me-reply sesuatu yang harmful untuk bangsa Indonesia,” jelas William.