著作権グループは、AIのトレーニングに使用されるオランダ語のデータセットを停止します

ジャカルタ - オランダに本拠を置く著作権団体BREINは、人工知能(AI)モデルのトレーニングに以前利用されていた大規模な言語データセットの配布を停止することに成功しました。このデータセットには、さまざまな映画やテレビシリーズから取得した何万もの本、ニュースサイト、オランダ語の字幕から許可なく収集された情報が含まれています。

Brianが8月13日火曜日に発表した声明によると、データ収集は正当な著作権所有者の同意なしに行われました。BREINのディレクター、Bastiaan van Ramshorst氏は、データセットがAI企業によってどの程度使用されたかはまだ明らかではないが、将来の訴訟を回避するために迅速に行動しようとしていると述べた。

「知るのは非常に難しいですが、私たちは時間通りに取り組んでいます」とVan Ramshorstは言いました。彼はまた、欧州連合(EU)の今後のAI法は、AI企業がモデルのトレーニングに使用されたデータセットを開示することを要求すると付け加えた。

米国では、マイクロソフトが支援するOpenAIは、許可なくAIモデルを訓練するために著作権で保護された素材を使用したと主張するニューヨークタイムズの1つを含む、いくつかの訴訟に直面しています。

デンマークでは、デンマークの権利保護団体アライアンスが昨年、「Books3」として知られる別の大規模なデータセットの配布を停止することに成功しました。

ブリテンによると、オランダ語のデータセットを提供した人物は、終了および引き出し命令の条件に同意し、ダウンロードできるWebサイトからそのデータセットを削除しました。BREINによると、組織はオランダのプライバシー規則に照らして、その人物の身元を明らかにしなかった。

このアクションは、デジタル時代において著作権を監視し、執行することがどれほど重要であるか、特にモデルを訓練するために大量のデータを活用することが多い人工知能技術の急速な発展に関連して示されています。