メタはFacebookとInstagramのパブリックポストを使用して、メタAI仮想アシスタントをトレーニングします

ジャカルタ-メタプラットフォーム社は、FacebookとInstagramの公開投稿を使用して、新しい仮想アシスタントであるMeta AIの一部を訓練しています。ただし、これには、消費者のプライバシーを尊重するために家族や友人とのみ共有されるプライベート投稿は含まれません。これは、同社のトップポリシーエグゼクティブがロイターのインタビューで伝えました。

メタはまた、メッセージングサービスでのプライベートチャットをモデルのトレーニングデータとして使用せず、トレーニングに使用される公開データセットの個人情報をフィルタリングするための措置を講じていると、グローバルメタアフェアーズの社長であるニッククレッグは、今週の会社の年次会議の傍らで語った。

「私たちは、非常に支配的な個人情報を含むデータセットを除外しようとしています」とクレッグは言いました。彼は、メタがトレーニングに使用するデータの「ほとんど」は公開されていると付け加えました。

彼はLinkedInを、メタがプライバシーの懸念から故意にコンテンツを使用しなかったWebサイトの例として挙げました。

クレッグのコメントは、メタ、OpenAI、アルファベットのGoogleなどのテクノロジー企業が、インターネットから取得した情報を許可なく使用してAIモデルをトレーニングし、大量のデータを吸収して情報を要約し、画像を生成していると批判されているためです。

これらの企業は、AIシステムが生成する可能性のあるプロセスで取られた個人または著作権資料を処理する方法を検討しているが、著作権侵害を非難する著者からの訴訟に直面している。

Meta AIは、MetaのCEOであるMark Zuckerbergが9月27日水曜日にMetaの年次製品会議「Connect」で明らかにした、消費者向けの同社の最初のAIツールの中で最も重要な製品です。今年のイベントは、最大かつ仮想現実に焦点を当てた以前の会議とは対照的に、人工知能に関する講演によって支配されています。

メタは、同社が7月に公共の商用利用のためにリリースした強力な大規模な言語モデルLlama 2と、テキスト要求に応じて画像を生成したEmuと呼ばれる新しいモデルに基づいて、アシスタントを使用したと同社は述べた。

この製品はテキスト、オーディオ、画像を生成することができ、MicrosoftのBing検索エンジンとのパートナーシップを通じてリアルタイムの情報にアクセスできます。

「メタAIのトレーニングに使用されるFacebookとInstagramの公開投稿には、テキストと写真が含まれています」とクレッグ氏は述べています。

これらの投稿は、製品イメージの世代の要素に対してEmuをトレーニングするために使用され、チャット機能はLlama 2に基づいており、公開され、注目されているデータセットがいくつかあると、Metaの広報担当者はロイターに語った。

「メタAIとのインタラクションは、将来の機能の改善にも使用できます」とクレッグ氏は述べています。

クレッグ氏によると、メタはメタAIのツールで作成できるコンテンツにセキュリティ制限を課しており、有名人のリアルな写真画像の作成が禁止されているという。

著作権で保護された素材に関して、クレッグ氏は、コメント、研究、パロディなどの目的で著作権で保護された作品の使用を制限できる「既存の合理的な使用の教義によってクリエイティブコンテンツがカバーされているかどうか」という問題に関して「多数の訴訟」が行われることを望んでいると述べた。

「そう思ったが、それが訴訟で役立つのではないかと非常に疑った」とクレッグは語った。

イメージング世代ツールを使用している企業の中には、ミッキーマウスのような象徴的なキャラクターのリプロダクティブ化を促進する企業もあれば、資料の料金を支払ったり、トレーニングデータに含めることを意図的に避けたりしている企業もあります。

例えば、OpenAIは今夏、コンテンツプロバイダーのShutterstockと6年間の契約を結び、同社の図書館の画像、ビデオ、音楽をトレーニングに使用しました。

メタが著作権で保護された画像の再現を避けるために同様の措置を講じたかどうか尋ねられたメタの広報担当者は、ユーザーがプライバシーと知的財産権を侵害するコンテンツを制作することを禁止する新しいサービス条件に言及しました。