BRIN 开发基于AI的多语言翻译模型,以保存武吉语言
雅加达 - 国家研究与创新局(BRIN)用新语言开发了基于人工智能(AI)的翻译模型的原型。该机构将添加武吉语。
BRIN通过为武吉语开发多语言翻译,希望保护濒临灭绝的区域语言。利用这一技术发展的倡议被认为能够防止文化遗产的丧失。
印度尼西亚有大约718种本地语言,但其使用量正在下降,因为人们倾向于使用印尼语或外语。越少地语言使用者,其语言就越有灭绝的危险。
看到这一点,BRIN通过数据与信息科学研究中心(PRSDI)开发了基于AI的区域语言模型。他们希望通过利用语言模型(LLM)来保护语言财富。
为了开发这种基于AI的多语言翻译,BRIN 与Hasanuddin大学文化科学学院和Handayani大学计算机科学学院合作。这一次,这三个人的重点是武吉语的原型。
通过开发多语言翻译,人们可以将武吉语转换为外语,如英语,西班牙语和俄语,反之亦然。此翻译以文本到文本,音频和视频到文本的格式运行。
BRIN开发的平台目前已经实施了大约14,000个武吉语单词。要查看可翻译单词,公众可以通过http://nlp-prototype.brin.go.id/ 网站访问原型。
未来,添加的武吉语单词数量可能会增加。但是,由于BRIN面临数据有限,并且难以找到合适的区域语言专家,因此不会很快增加这些词。