雅加达 - 一个总部位于硅谷的工程师,研究人员和芯片公司集团正在共同努力,发布先进的阿拉伯语软件,可以驱动生成AI应用程序。

Jais的新大语言模型包含130亿个参数,这些参数来自大量数据,结合了阿拉伯语和英语,其中一些来自计算机代码。该组织涉及学术界和工程师,部分原因是他们说,仍然很少有双语大语言模型。

新语言模型是在硅谷Cerebras Systems生产的超级计算机的帮助下创建的,该超级计算机设计了一个盘子大小芯片,该芯片与Nvidia的强大AI硬件竞争。Nvidia芯片的稀缺性,促使全球公司寻找替代品。

Jais根据阿拉伯联合酋长国最高峰期的名称命名,是Cerebras,Mohamed bin Zayed人工智能大学和Abu Dhabi科技集团G42的子公司合作的结果,该集团以AI为重点。

由于阿拉伯语数据不足以训练像Jais这样的模型,因此英语数据中的计算机代码有助于训练模型思维能力,人工智能大学教授Mohamed bin Zayed Timothy Baldwin说。

「(代码)使模型在思维能力方面具有巨大的优势,因为它解释了步骤(逻辑),」鲍德温告诉路透社。Jais 将通过开源许可证提供。

Jais模型在Cerebras超级计算机Condor Galaxy上训练。今年,Cerebras宣布已向G42出售了三台此类装置,第一台计划于今年到达,其余装置将于2024年交付。


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)