Bagikan:

JAKARTA - Yandex, sebuah perusahaan teknologi global, baru saja meluncurkan YaFSDP, sebuah metode open-source untuk melatih Large Language Model (LLM) yang memungkinkan AI generatif untuk berinteraksi dengan pengguna secara real-time.

Sebagai bagian dari komitmen perusahaan untuk berkontribusi pada komunitas artificial intelligence (AI) global, Yandex membuat YaFSDP tersedia untuk umum bagi para pengembang LLM dan penggemar AI di seluruh dunia. 

“Besar harapan kami ini bisa berkontribusi pada peningkatan aksesibilitas dan efisiensi bagi para peneliti dan pengembang AI generatif di seluruh dunia,” jelas Mikhail Khruschev, Senior Developer Yandex dan Tim YaFSDP dalam pernyataannya dikutip Rabu, 12 Juni. 

Yandex mengatakan bahwa YaFSDP mampu mengoptimalkan kecepatan dan kinerja pembelajaran, sehingga memungkinkan pengembang AI di seluruh dunia untuk menggunakan lebih sedikit daya komputasi dan sumber daya GPU saat melatih model mereka. 

Saat ini, YaFSDP merupakan metode paling efektif dalam melatih LLM dibandingkan dengan metode Fully Sharded Data Parallel (FSDP) lainnya yang tersedia di publik. 

Dengan YaFSDP, kecepatan bisa ditingkatkan hingga 26 persen dibandingkan dengan FSDP biasa, tergantung pada arsitektur dan jumlah parameter. Sehingga, waktu pelatihan untuk LLM bisa dikurangi sekaligus menghemat penggunaan sumber daya GPU hingga 20 persen. 

“YaFSDP telah menunjukkan hasil yang mengesankan pada model yang menangani 13 hingga 70 miliar parameter, dengan kinerja yang sangat kuat pada kisaran 30 hingga 70 miliar,” kata Mikhail. 

“Saat ini, kami melihat bahwa YaFSDP paling cocok untuk model open-source yang digunakan secara luas berdasarkan arsitektur LLaMA,” tambahnya.