JAKARTA - Meta Platforms Inc... 使用Facebook和Instagram的公开帖子来培训他们的新虚拟助手Meta AI的一部分。但这不包括仅与家人和朋友分享的私人帖子,以尊重消费者隐私。这是该公司最高政策管理层在接受采访时向路透社传达的。

Meta也不使用其消息传递服务中的私人聊天作为模型的培训数据,并且正在采取措施从用于培训的公共数据集中过滤个人详细信息,Global Meta Affairs总裁Nick Clegg表示,他本周在公司年度会议期间发表讲话。

“我们正试图排除包含高度占主导地位的个人信息的数据集,”Clegg说。他补充说,Meta用于培训的“大多数”数据都是公开的。

他举了一个例子,举了一个例子,举了一个例子,举了一个例子,举了一个例子,举了一个例子,举了一个例子,举了一个例子,举了一个例子,举了一个例子,举了一个例子。

Clegg的评论来自Meta,OpenAI和Alphabet拥有的Google等科技公司因未经许可使用从互联网获取的信息来训练其AI模型而受到批评,这些模型吸收大量数据以收集信息并产生图像。

这些公司正在考虑如何处理其AI系统可能产生的流程中提取的私人或版权材料,同时面临著作者的诉讼,指控他们侵犯版权。

Meta AI是该公司首批面向消费者的人工智能工具中最重要的产品,Meta首席执行官马克·扎克伯格(Mark Zuckerberg)于9月27日星期三在Connect的年度Meta产品大会上透露。今年的活动以人工智能为主,与之前的集中在最大和虚拟现实的会议不同。

该公司表示,Meta使用了一种特殊的模型,该助手基于该公司于7月发布的强大Llama 2大语言模型,以及一款名为Emu的新模型,该模型为响应文本请求而产生图像。

该产品将能够生成文本、音频和图像,并将通过与微软Bing搜索引擎的合作,可以访问实时信息。

“用于训练Meta AI的Facebook和Instagram帖子包括文本和照片,”Clegg说。

Meta发言人告诉路透社,这些帖子用于训练Emu用于产品图像的一代元素,而聊天功能则基于Llama 2,其中一些数据集是公开可用和注定的。

“与Meta AI的互动也可以用来改善未来的功能,”Clegg说。

Clegg表示,Meta对Meta AI工具可能生成的内容实施安全限制,例如禁止制作知名人物的逼真的照片。

关于版权材料,Clegg表示,他希望“创意内容是否被现有合理使用的教义所涵盖”的问题将存在“一系列诉讼”,允许有限地使用受版权保护的作品,用于评论,研究和悖论等目的。

“我们认为是的,但我非常怀疑它将在诉讼中发挥作用,”克莱格说。

一些具有图像代工具的公司促进微鼠等标志性角色的繁殖,而其他公司则支付了材料费用或故意避免将其纳入培训数据。

例如,OpenAI今年夏天与内容提供商Shutterstock签署了一项为期六年的协议,将该公司的图像、视频和音乐图书馆用于培训。

当被问及Meta是否采取了类似措施来避免版权图像的复制时,Meta发言人提到了新服务条款,禁止用户创建侵犯隐私和知识产权的内容。


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)