Jais语言模型,硅谷芯片工程师和公司合作,开发阿拉伯语AI

雅加达 - 一个总部位于硅谷的工程师,研究人员和芯片公司集团正在共同努力,发布先进的阿拉伯语软件,可以驱动生成AI应用程序。

Jais的新大语言模型包含130亿个参数,这些参数来自大量数据,结合了阿拉伯语和英语,其中一些来自计算机代码。该组织涉及学术界和工程师,部分原因是他们说,仍然很少有双语大语言模型。

新语言模型是在硅谷Cerebras Systems生产的超级计算机的帮助下创建的,该超级计算机设计了一个盘子大小芯片,该芯片与Nvidia的强大AI硬件竞争。Nvidia芯片的稀缺性,促使全球公司寻找替代品。

Jais根据阿拉伯联合酋长国最高峰期的名称命名,是Cerebras,Mohamed bin Zayed人工智能大学和Abu Dhabi科技集团G42的子公司合作的结果,该集团以AI为重点。

由于阿拉伯语数据不足以训练像Jais这样的模型,因此英语数据中的计算机代码有助于训练模型思维能力,人工智能大学教授Mohamed bin Zayed Timothy Baldwin说。

「(代码)使模型在思维能力方面具有巨大的优势,因为它解释了步骤(逻辑),」鲍德温告诉路透社。Jais 将通过开源许可证提供。

Jais模型在Cerebras超级计算机Condor Galaxy上训练。今年,Cerebras宣布已向G42出售了三台此类装置,第一台计划于今年到达,其余装置将于2024年交付。