BRIN、KORIKA、GDP Venture、AI Singaporeは、SEA-LIONプラットフォームを通じてインドネシア語LLMを開発しています

ジャカルタ - 国立研究イノベーション庁(BRIN)、人工知能研究イノベーション協力(KORIKA)、およびGDP Ventureの2つのポートフォリオ、すなわちGlair.ai と Datasaur.ai、インドネシア語のLarge言語モデル(LLM)の構築に協力しています。

このLLMは、AIシンガポール製のSEA-LIONプラットフォームを通じて発表されます。うまくいけば、このプラットフォームは多くの関係者によって使用され、インドネシア語での科学の技術と応用がより高度になることを願っています。

AI Singaporeの戦略、パートナーシップ、成長の責任者であるDariaus Liu氏は、GPTのようなジェネレーティブAIはすでにほぼすべての国で利用可能だが、彼の言語能力は英語などの西部地域でのみ優れていると述べた。

「私たちは今、この問題を解決するために協力しなければなりません。AIシンガポールは、特に東南アジアに焦点を当てた小さなLLMファミリーを訓練するために3つのことを達成するためのLLMプログラムを準備しました」とダレイオスは11月30日木曜日に5つの機関間の協力を発表しながら述べました。

これらの障害により、AIシンガポールはインドネシア語のLLMをプラットフォームに開発しようとしています。まだ開発段階ですが、SEA-LIONは数回テストされており、GPT-4やLlama 2などの大きなダウチャットボットと比較されています。

シンガポールのAIテストの結果から、SEA-LIONはGPTやLlamaと比較してインドネシア語を使用する際に繰り返しより良い反応を示しました。感情の分析に対する相互協力とは何かという単純な質問です。

3つのチャットボティーニプラットフォームは比較されていますが、AIシンガポールはGPTやLlamaと比較した場合、SEA-LIONの精度がどの程度高いかを言うことはできませんでした。しかし、同社はすでにパーセンテージの量をポケットに入れています。

「後で、SEAとLIONの比較が何パーセント、長い間何パーセントであるかを公表する予定です」と、シンガポールのAI人工知能責任者ウィリアム・チヒは、VOIから尋ねられたとき、述べました。

ウィリアムはまた、英語のバーワブンチマークは非常に簡単に作成できますが、東南アジア地域の言語では異なると説明しました。したがって、AIシンガポールはゼロから具体的なベンチマークを作成する必要があります。

一方、ウィリアムは、その安全性について尋ねられたとき、それが彼らのプラットフォームの開発に加えて彼らの主な焦点だったと言いました。ただし、このプラットフォームのセキュリティには、BRINやKORIKAを含むすべての機関の協力が必要です。

「この意図は、より広いコミュニティでアクセス可能になるでしょう、なぜならこれはキャノペンソースだからです。ただ、開発者である私たちは反応性を持たなければなりません。私たちは、LLMがインドネシア国民にとって相応しいものに反応しないというスレバワを使わなければなりません」とウィリアムは説明しました。