Meta aurait utilisé des milliers de livres interdits pour entraîner des modèles d’IA, bien qu’il ait reçu des avertissements juridiques
JAKARTA - Meta Platforms, la société mère de Facebook et Instagram, aurait utilisé des milliers de livres illicites pour former leurs modèles d’intelligence artificielle (IA). Cela a été fait, bien qu’un avertissement juridique a été donné sur des questions de droit d’auteur. Le rapport apparaît dans un procès de violation du droit d’auteur déposé par la comique Sarah Silverman et un certain nombre d’autres auteurs bien connus.
Le plaignant a déclaré que Meta avait utilisé son travail sans autorisation pour former un modèle de langue d’IA connu sous le nom de Llama. Un récent document, qui a combiné deux poursuites plus tôt déposées, révèle que les avocats de Meta avaient déjà averti l’entreprise des risques juridiques qui pourraient découler de l’utilisation de milliers de livres piratés pour entraîner des modèles d’IA.
Le document comprenait également une conversation sur le serveur Discord entre un chercheur affilié à Meta, Tim Dettlers, qui a discuté de l’acquisition du ensemble de données. La conversation a enregistré une discussion avec le département juridique de Meta concernant la légalité de l’utilisation des fichiers de livre comme don de formation.
Un chercheur a déclaré que de nombreuses personnes sur Facebook sont intéressées par le travail avec certains ensemble de données, mais ne peuvent pas les utiliser pour des raisons juridiques. Dans la conversation, les chercheurs ont également mentionné « livres avec droits d’auteur actifs » comme une source potentielle de problème et ont affirmé que la formation sur ces données devrait « inclure une utilisation raisonnable », une doctrine juridique américaine qui protège certaines utilisations contre les œuvres droits d’auteur sans licence.
Le procès intervient au milieu d’une série de poursuites judiciaires contre des entreprises technologiques par des créateurs de contenu qui les accusaient d’utiliser des œuvres droit d’auteur sans autorisation pour construire des modèles génératifs d’IA. Le succès de ces affaires peut changer la tendance générative d’IA en encourageant les entreprises d’IA à compenser les artistes, les auteurs et d’autres créateurs de contenu pour leur utilisation.
Jusqu’à présent, Meta n’a pas donné de réponse à ces allégations.