シェア:

ジャカルタ - 最近のレポートによると、AppleはYouTubeのビデオを使用してAIモデルであるApple Intelligenceをトレーニングしました。これは、プラットフォームのコンテンツポリシーに違反していると言われています。

Wiredと共同で公開されたProof Newsが実施した調査によると、AppleとNvidiaやAnthropicを含む他のいくつかのテクノロジー企業は、ユーザーが生成した公開データを使用してAIモデルをトレーニングしています。

調査によると、Appleは48,000以上のチャンネルからの173,536のYouTubeビデオのトランスクリプトを含むYouTubeサブティットと呼ばれるデータセットを使用しました。このデータセットのビデオには、カーンアカデミーやMITなどの教育チャンネルからウォールストリートジャーナルなどのニュースサイト、MrBeastやMarcas Brownleeなどのプラットフォーム上のいくつかの著名なクリエイターまで、さまざまな種類のコンテンツが含まれています。

Marcas Brownlee氏は、Appleはデータを直接使用するのではなく、YouTubeビデオからトランスクリプトを使用する企業からAIを取得するため、技術的にエラーを回避したと述べた。ただし、これらのデータとトランスクリプトは、クリエイターが時間とお金を投資してきたAIモデルに貢献しています。ブラウンリーは、これは長い間成長してきた問題であると結論付けました。

プルーフニュースは、クリエイターがデータセット内のコンテンツを検索するためのツールも作成しました。YouTube Subtitlesのデータセットには、動画の画像は含まれていませんが、複数の言語に翻訳された字幕が含まれています。このデータセットは、オープンサイエンスの規範の促進に焦点を当てたEleason AIと呼ばれる非営利の研究所によって作成されたと伝えられています。

レポートで言及された企業のどれも、この問題について直ちにコメントしませんでした。YouTubeのCEOであるNeal Mohan氏はインタビューで、YouTubeのビデオを使用してAIモデルをトレーニングする企業は、プラットフォームのポリシーの「明白な違反」であると明確に述べていました。


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)