Meta为非书面语言开发AI翻译器

雅加达 - Meta正在开发他们的通用语音翻译系统,预计未来该系统将训练人工智能实时翻译数百种语言。

这家科技巨头声称已经产生了第一个人工智能来翻译福建话,福建话是整个Tawian使用的语言,说的但不是书面的。

“这个翻译系统是Meta AI通用语音翻译项目的第一个里程碑,该项目的重点是开发一个AI系统,提供所有语言的实时语音到语音翻译,甚至是口语,”Meta在一份声明中说。

Meta人工智能项目的目的不仅是让元宇宙居民更容易互动,也是为了翻译更多没有正式书写系统的语言。

根据马克·扎克伯格(Mark Zuckerberg)拥有的公司的数据,世界上已知的大约7000种语言中有近一半,其中四种没有附带书面成分。

这些不成文的语言给现代机器学习翻译系统带来了一个独特的问题,因为它们通常需要在翻译成新语言并将文本返回到语音之前将口头语音转换为书面文字。

“(为了解决这个问题)我们使用语音到单元(S2UT)翻译将输入语音直接转换为先前由Meta开创的路径中的声学单元序列,”扎克伯格在10月20日星期四援引Engadget的话解释道。

“然后,我们从该单元生成波形。此外,该单元被采用两次用于代码解码机制,其中第一行解码器以相应的语言(中文)生成文本,第二行解码器创建单元,“他补充说。

目前福建翻译人员仍在进行中,因为人工智能一次只能翻译一个句子,但它已经作为开源发布,以便其他研究人员可以开发它。

此外,该公司还发布了 SpeechMatrix,这是通过meta创新的自然语言处理工具开发的大量语音到语音翻译的集合。