版权集团停止用于训练人工智能的荷语数据库

雅加达 - 总部位于荷兰的版权执法组织BREIN已成功阻止分发以前用于练习人工智能(AI)模型的大型语言数据。该数据库包括未经许可从数万本书、新闻网站以及从各种电影和电视剧中提取的荷兰字母缩写中收集的信息。

根据BREIN于8月13日(星期二)发布的一份声明,数据收集是在未经合法版权所有者批准的情况下进行的。BREIN董事Bastiaan van Ramshorst表示,虽然目前尚不清楚AI公司在多大程度上使用了数据,但它正试图迅速采取行动,以避免未来的诉讼。

范拉姆肖尔斯特说:“这很难知道,但我们正在努力按时完成。他还补充说,即将到来的欧盟AI法案将要求人工智能公司披露其模型培训中使用的数据库。

在美国,微软支持的OpenAI面临多项诉讼,包括《纽约时报》的一项诉讼,该诉讼指控未经许可使用版权材料来练习人工智能模型。

丹麦,一个名为丹麦人权联盟的版权保护组织此前曾设法阻止了去年另一个被称为“Books3”的大型数据库的分发。

提供荷兰语数据集的人已同意终止和撤回命令的条款,并已从可用下载的网站中删除数据。该组织没有透露该人的身份,因为荷兰的隐私规则。

这一行动表明了在数字时代监控和执法版权的重要性,特别是与人工智能技术的快速发展有关,人工智能技术经常利用大量数据来训练其模型。