Meta Rilis Model Bahasa Besar LLaMA, untuk Meningkatkan Kemampuan AI

JAKARTA - Meta Platforms Inc mengumumkan pada Jumat 24 Februari bahwa mereka akan merilis model bahasa besar baru yang disebut LLaMA, singkatan dari Large Language Model Meta AI, untuk peneliti dan lembaga yang terafiliasi dengan pemerintah, masyarakat sipil, dan akademisi.

Langkah ini memanaskan persaingan dalam dunia kecerdasan buatan (AI) karena perusahaan teknologi besar tengah berlomba-lomba untuk mengintegrasikan teknologi ini ke dalam produk mereka dan mereka juga ingin mengesankan investor.

Model bahasa besar digunakan untuk menyederhanakan informasi dan menghasilkan konten. Mereka dapat menjawab pertanyaan dengan kalimat yang terlihat seolah-olah ditulis oleh manusia. LLaMA dari Meta dilatih pada 20 bahasa dengan fokus pada bahasa yang menggunakan abjad Latin dan Cyrillic.

"Pengumuman Meta hari ini terlihat sebagai langkah untuk menguji kemampuan AI generatif mereka sehingga mereka dapat mengimplementasikannya ke dalam produk mereka di masa depan," kata Gil Luria, analis perangkat lunak senior di D.A. Davidson, seperti dikutip Reuters.

"AI generatif adalah aplikasi baru dari AI yang Meta memiliki pengalaman yang kurang, tetapi jelas penting untuk masa depan bisnis mereka," tambahnya.

Meta mengklaim bahwa LLaMA memerlukan "daya komputasi yang jauh lebih sedikit" daripada model sebelumnya, dan dapat mengungguli pesaing yang memeriksa lebih banyak parameter. Versi LLaMA dengan 13 miliar parameter dapat mengungguli GPT-3, pendahulu baru dari model pada ChatGPT.

Meta juga mengklaim bahwa model LLaMA mereka yang berisi 65 miliar parameter "kompetitif" dengan Chinchilla70B dan PaLM-540B dari Google. Model LLaMA ini diharapkan dapat meningkatkan kemampuan Meta dalam bidang AI generative.

Pengumuman ini menunjukkan bahwa AI menjadi ladang investasi yang menjanjikan di industri teknologi, yang pertumbuhannya melambat dan menyebabkan pemotongan anggaran serta pengurangan risiko eksperimental.

Meta sebelumnya telah merilis model bahasa besar OPT-175B pada Mei 2021 yang juga ditujukan untuk para peneliti, dan model tersebut menjadi dasar dari pembuatan chatbot BlenderBot.

Kemudian, Meta juga memperkenalkan model bernama Galactica yang dapat menulis artikel ilmiah dan memecahkan masalah matematika, tetapi mereka kemudian menarik demo model tersebut setelah menghasilkan respons palsu yang terdengar otoritatif.