元维基发布LLaMA大语言模型,提升AI能力

雅加达 - Meta Platforms公司于2月24日星期五宣布,它将发布一种新的主要语言模型LLaMA,是大型语言模型Meta AI的缩写,适用于政府,民间社会和学术界的研究人员和机构。

此举加剧了人工智能(AI)领域的竞争,因为大型科技公司正在争相将这项技术集成到他们的产品中,他们也希望给投资者留下深刻印象。

大型语言模型用于简化信息和生成内容。他们可以用看起来像是人类写的句子来回答问题。来自 Meta 的 LLaMA 接受 20 种语言的培训,重点是使用拉丁字母和西里尔字母的语言。

“Meta今天的公告看起来像是测试其生成AI能力的举措,以便他们将来可以将其实施到他们的产品中,”D.A. Davidson高级软件分析师Gil Luria表示。

“生成式人工智能是人工智能的一种新应用,Meta 的经验较少,但显然对其业务的未来很重要,”他补充说。

Meta声称LLaMA需要的计算能力比以前的模型“明显更少”,并且可以超越检查更多参数的竞争对手。具有 130 亿个参数的 LLaMA 版本可以胜过 GPT-3,这是 ChatGPT 上模型的新前身。

Meta还声称,他们包含650亿个参数的LLaMA模型与谷歌的Chinchilla70B和PaLM-540B“竞争”。这种LLaMA模型有望增强Meta在生成AI领域的能力。

该公告表明,人工智能正在成为技术行业中一个有前途的投资领域,其增长正在放缓,并导致预算削减以及实验性风险降低。

Meta 此前曾在 2021 年 5 月发布了同样针对研究人员的大语言模型 OPT-175B,该模型成为创建 BlenderBot 聊天机器人的基础。

后来,Meta 还推出了一个名为 Galactica 的模型,该模型可以撰写科学文章并解决数学问题,但他们后来在生成听起来很权威的错误响应后撤回了该模型的演示。