Partager:

AKARTA - Une nouvelle controverse revient dans le monde de l’intelligence artificielle (IA). Cette fois, Meta est accusé d’entraîner le modèle de langue majeure Llama (LLM), qui soutient Meta AI, en utilisant du contenu piraté obtenu à partir de torrents. L’affaire est devenue l’un des premiers poursuites sur le droit d’auteur contre une société technologique liée à la formation à l’IA.

ina, surnommé "Kadrey et al. v. Meta est confronté à un procès en 2023 accusés d’utilisation de contenu piratage pour former Llama. L’affaire, connue sous le nom de «Kadrey et al. v. Meta Platforms » a été déposée par les auteurs Richard Kadrey et Christopher Golden, accusant Meta d’utiliser du contenu droit d’auteur sans autorisation.

, Meta a soumis des documents contenant des informations éditées au tribunal. Cependant, le juge Vince Chhabria du tribunal de district des États-Unis pour le district de Californie du nord a ordonné que les documents originaux soient rendus publics - et finalement révélés au public.

. Le document montre une conversation entre les employés de Meta sur Meta AI et Llama. Dans une conversation, un ingénieur a déclaré que « télécharger des torrents depuis un ordinateur portable de l’entreprise [Meta] semblait incorrect », ce qui renforce les allégations selon lesquelles l’entreprise utilise du contenu piraté pour former son AI. Une autre conversation indiquait que « MZ » (Mark Zuckerberg) a donné son approbation à l’utilisation de matériel piraté.

al sur la base d’informations suggère que Meta utilise du contenu de Lib Gen, une grande bibliothèque contenant des livres, des magazen et des articles académiques pirates. Lib Gen a été fondé en Russie en 2008 et a fait face à diverses poursuites sur le droit d’auteur, bien que son opérateur reste anonyme. En outre, Meta aurait utilisé du contenu d’autres bibliothèques ombrières pour la formation à l’IA.

Meta soutient qu’ils utilisent du matériel public dans le cadre de la doctrine juridique du « utilisation équitable », qui permet l’utilisation sans autorisation du contenu droit d’auteur dans certaines situations. Meta affirme qu’il ne « utilisent que le texte pour modéliser statistiquement la langue et produire des expressions authentiques ».

ar, au début de l'année dernière, l'enquête a révélé que le modèle OpenELM d'Apple couvre des sous-titres de plus de 170 000 vidéos YouTube.

el, cependant, Apple a expliqué plus tard qu’OpenELM est un modèle à base ouverte à des fins de recherche et ne fait pas partie de la base de données utilisée par Apple Intelligence. Selon Apple, leurs fonctionnalités d’IA sont formées en utilisant « des données sous licence, y compris des données sélectionnées pour améliorer certaines fonctionnalités, ainsi que des données publiques recueillies par nos navigateurs Web ».

rénal, de nombreux importants éditeurs tels que le New York Times et l’Atlantic choisissent de ne pas partager leur contenu pour la formation à l’Apple Intelligence.

al est une préoccupation majeure pour le monde de la technologie et du droit, en particulier en établissant des restrictions sur l’utilisation des données droits d’auteur pour la formation d’IA.


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)

Add VOI as a Preferred Source
Follow VOI news updates across Google.
+