元维基发布LLaMA大语言模型，提升AI能力

雅加达 - Meta Platforms公司于2月24日星期五宣布，它将发布一种新的主要语言模型LLaMA，是大型语言模型Meta AI的缩写，适用于政府，民间社会和学术界的研究人员和机构。

此举加剧了人工智能（AI）领域的竞争，因为大型科技公司正在争相将这项技术集成到他们的产品中，他们也希望给投资者留下深刻印象。

大型语言模型用于简化信息和生成内容。他们可以用看起来像是人类写的句子来回答问题。来自 Meta 的 LLaMA 接受 20 种语言的培训，重点是使用拉丁字母和西里尔字母的语言。

“Meta今天的公告看起来像是测试其生成AI能力的举措，以便他们将来可以将其实施到他们的产品中，”D.A. Davidson高级软件分析师Gil Luria表示。

“生成式人工智能是人工智能的一种新应用，Meta 的经验较少，但显然对其业务的未来很重要，”他补充说。

Meta声称LLaMA需要的计算能力比以前的模型“明显更少”，并且可以超越检查更多参数的竞争对手。具有 130 亿个参数的 LLaMA 版本可以胜过 GPT-3，这是 ChatGPT 上模型的新前身。

Meta还声称，他们包含650亿个参数的LLaMA模型与谷歌的Chinchilla70B和PaLM-540B“竞争”。这种LLaMA模型有望增强Meta在生成AI领域的能力。

该公告表明，人工智能正在成为技术行业中一个有前途的投资领域，其增长正在放缓，并导致预算削减以及实验性风险降低。

Meta 此前曾在 2021 年 5 月发布了同样针对研究人员的大语言模型 OPT-175B，该模型成为创建 BlenderBot 聊天机器人的基础。

后来，Meta 还推出了一个名为 Galactica 的模型，该模型可以撰写科学文章并解决数学问题，但他们后来在生成听起来很权威的错误响应后撤回了该模型的演示。