Meta 使用 Facebook 和 Instagram 公共帖子来培训 Meta AI 虚拟助理

JAKARTA - Meta Platforms Inc... 使用Facebook和Instagram的公开帖子来培训他们的新虚拟助手Meta AI的一部分。但这不包括仅与家人和朋友分享的私人帖子,以尊重消费者隐私。这是该公司最高政策管理层在接受采访时向路透社传达的。

Meta也不使用其消息传递服务中的私人聊天作为模型的培训数据,并且正在采取措施从用于培训的公共数据集中过滤个人详细信息,Global Meta Affairs总裁Nick Clegg表示,他本周在公司年度会议期间发表讲话。

“我们正试图排除包含高度占主导地位的个人信息的数据集,”Clegg说。他补充说,Meta用于培训的“大多数”数据都是公开的。

他举了一个例子,举了一个例子,举了一个例子,举了一个例子,举了一个例子,举了一个例子,举了一个例子,举了一个例子,举了一个例子,举了一个例子,举了一个例子。

Clegg的评论来自Meta,OpenAI和Alphabet拥有的Google等科技公司因未经许可使用从互联网获取的信息来训练其AI模型而受到批评,这些模型吸收大量数据以收集信息并产生图像。

这些公司正在考虑如何处理其AI系统可能产生的流程中提取的私人或版权材料,同时面临著作者的诉讼,指控他们侵犯版权。

Meta AI是该公司首批面向消费者的人工智能工具中最重要的产品,Meta首席执行官马克·扎克伯格(Mark Zuckerberg)于9月27日星期三在Connect的年度Meta产品大会上透露。今年的活动以人工智能为主,与之前的集中在最大和虚拟现实的会议不同。

该公司表示,Meta使用了一种特殊的模型,该助手基于该公司于7月发布的强大Llama 2大语言模型,以及一款名为Emu的新模型,该模型为响应文本请求而产生图像。

该产品将能够生成文本、音频和图像,并将通过与微软Bing搜索引擎的合作,可以访问实时信息。

“用于训练Meta AI的Facebook和Instagram帖子包括文本和照片,”Clegg说。

Meta发言人告诉路透社,这些帖子用于训练Emu用于产品图像的一代元素,而聊天功能则基于Llama 2,其中一些数据集是公开可用和注定的。

“与Meta AI的互动也可以用来改善未来的功能,”Clegg说。

Clegg表示,Meta对Meta AI工具可能生成的内容实施安全限制,例如禁止制作知名人物的逼真的照片。

关于版权材料,Clegg表示,他希望“创意内容是否被现有合理使用的教义所涵盖”的问题将存在“一系列诉讼”,允许有限地使用受版权保护的作品,用于评论,研究和悖论等目的。

“我们认为是的,但我非常怀疑它将在诉讼中发挥作用,”克莱格说。

一些具有图像代工具的公司促进微鼠等标志性角色的繁殖,而其他公司则支付了材料费用或故意避免将其纳入培训数据。

例如,OpenAI今年夏天与内容提供商Shutterstock签署了一项为期六年的协议,将该公司的图像、视频和音乐图书馆用于培训。

当被问及Meta是否采取了类似措施来避免版权图像的复制时,Meta发言人提到了新服务条款,禁止用户创建侵犯隐私和知识产权的内容。