Partager:

JAKARTA - La plate-forme de médias sociaux Reddit a annoncé mardi 25 juin qu’elle mettrait à jour les normes Web utilisées par la plate-forme pour empêcher la collecte automatique de données sur son site Web. Cette décision a été prise après que des rapports aient mentionné que les startups d’IA ont reconnu les règles pour collecter du contenu pour leurs systèmes.

L’annonce intervient à un moment où les entreprises d’IA ont été accusées de plagiariser le contenu auprès d’éditeurs pour créer des résumons d’IA sans donner de crédit ou demander de permis.

Reddit a déclaré qu’il mettra à jour le protocole d’exclusion des robots, ou « robots.txt », une norme largement acceptée visant à déterminer quelles parties du site peuvent être indexées par les moteurs de recherche. La société maintiendra également des restrictions de vitesse, des techniques utilisées pour contrôler le nombre de demandes d’une entité spécifique et blocera les bots et des tracker inconnus de la collecte de données sur son site Web.

Récemment, robots.txt est devenu un outil important utilisé par les éditeurs pour empêcher les entreprises technologiques d’utiliser gratuitement leurs contenus pour former des algorithmes d’IA et créer des résumés en réponse à plusieurs quêtes de recherche.

La semaine dernière, une lettre à l’éditeur de la start-up licence de contenu TollBit a déclaré que plusieurs entreprises d’IA reconnaissaient les normes Web pour collecter des données auprès des sites d’édite.

Cela fait suite à une enquête menée par Wired qui a révélé que la start-up de recherche d’IA, Perplexity, a probablement reconnu les efforts pour bloquer leurs crawler Web via robots.txt.

Début juin, l’éditeur des médias d’affaires du Forbes a accusé Perplexity d’avoir plagiatisé son histoire d’enquête pour être utilisée dans des systèmes génératifs d’IA sans accord de crédit.

Reddit a également déclaré mardi que les chercheurs et les organisations telles que l’archive d’Internet auraient toujours accès à son contenu pour une utilisation non commerciale.


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)