La société de licence dataset AI forme un nouveau groupe commercial
JAKARTA - La société d’octroi de licences de contenu pour la musique, les images, la vidéo et d’autres ensembles de données utilisés dans la formation aux systèmes d’intelligence artificielle a formé le premier groupe commercial du secteur, annoncé mercredi 26 juin.
L’Alliance des fournisseurs de données (DPA) défendra une « source de données éthique » dans la formation des systèmes d’IA, y compris les droits des personnes décrites dans le groupe de données et la protection des droits de propriété intellectuelle des propriétaires de contenu, selon une déclaration de la société.
Les membres fondateurs comprennent la société américaine de dataset musical, Rightsify; Service de licence d’images, vAIsual; fournisseur de photos stock japonais, Pixta; et le marché allemand de données, Datarade.
L’émergence d’une technologie génératrice d’IA capable d’imiter la créativité humaine ces dernières années a suscité des manifestations des créateurs de contenu et une série de poursuites sur le droit d’auteur contre des entreprises technologiques telles que Google, Meta et le créateur de chatGPT OpenAI, soutenues par Microsoft.
Les développeurs ont formé le modèle en leur donnant une énorme quantité de contenu, dont beaucoup sont extraits d’Internet gratuitement sans le consentement de ceux qui ont créé l’œuvre ou le détenaient des droits. Les entreprises technologiques prétendent que cette utilisation est légale, mais accordent également secrètement l’accès à des collections de contenu personnelles pour répondre aux besoins spécifiques de données et éviter les risques juridiques et réglementaires.
Les perspectives selon lesquelles la demande de données sous licence augmentera si les propriétaires de droits d’auteur gagnent dans leurs batailles légales ont encouragé l’émergence d’une nouvelle industrie d’entreprises qui emballent du contenu et y vendent accès pour une utilisation par des systèmes d’IA. En conséquence, des groupes ont été formés pour établir des normes éthiques pour le commerce, telles que Fairly Traped, une organisation à but non lucratif fondée cette année qui certifie des modèles qui ne utilisent pas de matériel droit d’auteur sans licence.
DPA cible le contenu de la transaction, exigeant que ses membres ne vendent pas de données texte obtenues en navigant sur le Web ou en audio qui affichent les voix des gens sans leur consentement explicite. L’accent principal sera mis sur l’encouragement de législations telles que le NO FAKES Act, une loi américaine introduite l’année dernière pour créer des sanctions pour la fabrication de répliques numériques de la voix ou de ressemblances de personnes sans permis, a déclaré Alex Bestall, PDG de Rightssify et sa filiale licence, GCX, qui dirige la création du groupe.
« Les plaintes fassent une grande partie de cela parce que tout le monde a pris sa position sur l’IA et le droit d’auteur, mais beaucoup de ces combats ne sont pas résolus et prendront du temps pour le résoudre », a déclaré Bestall.
« La DPA encouragera également les exigences de plus de transparence des données de formation telles que la loi européenne sur l’IA et les lois américaines similaires introduites en avril, à savoir la Loi générative sur la divulgation du droit d’auteur d’IA », a-t-il ajouté.
« Nous prévoyons de publier un document blanc décrivant notre position en juillet », a-t-il déclaré.