ne jouez pas à la trompée! Apple explique comment entraîner l’IA conformément aux règles

ARTA - Dans un récent document de recherche, Apple a réitéré ses affirmations selon lesquelles son modèle d’intelligence de fabrication, l’Apple Intelligence, n’était pas formé à utiliser des données extraites illégalement d’Internet.

, à un moment où de nombreux systèmes d'intelligence artificielle (IA) recueillent massivement des données à travers le Web, Apple a souligné qu’ils se conforment à l’éthique dans le processus de formation de ses modèles.

En 2023, de grandes entreprises telles que OpenAI et Microsoft avaient été confrontées à un procès contre le New York Times pour des allégations de violation du droit d’auteur liées à la collecte de données non autorisée.

- Contrairement à ces pratiques générales, Apple aurait tenté en 2023 d’acheter des droits de licence auprès d’éditeurs majeurs tels que Conde Nast et NBC News pour utiliser leur travail dans les modèles de grande langue (LLM). Apple aurait offert des millions de dollars, bien qu’il ne soit pas encore clair quel éditeur accepterait ou refusait à ce moment-là.

ina, dans son récemment publié, Apple a expliqué qu’il n’accéderait pas ou ne prenerait aucune information d’éditeurs non autorisés.

ina écrit : « Nous pensons dans la formation des modèles à l’utilisation de données mitigées et de haute qualité. Cela inclut les données que nous lisensons auprès d’éditeurs, les données qui sont divulguées à partir d’un ensemble de données ouvert ou publiquement disponibles, ainsi que les informations obtenues par l’Apple Bot, notre navigateur Web », a déclaré Apple dans son blog.

Apple a également souligné qu’il n’utilisait pas les données personnelles des utilisateurs ni les interactions utilisateur lors de la formation de leurs modèles de fondation. La société prend diverses mesures pour dépister et supprimer des informations personnelles et éviter le matériel inapproprié ou nuisible.

an, en particulier sur le papier et explique comment les robots d'Apple travaillent pour extraire des données pertinentes et de qualité d’Internet plein de “numéro de silhouette”. Cependant, Apple a également souligné son engagement en faveur du droit d’auteur et de la éthique, en suivant le protocole robots.txt couramment utilisé par le site Web.

robots.txt permet aux éditeurs de déterminer quelles pages ou parties du site ne devraient pas être accédées par des navigateurs Web, y compris celles utilisées pour entraîner les modèles d’IA. Apple a déclaré qu’elles respectaient cette règle, donnant à l’éditeur des contrôles détaillés sur le contenu auquel le bot Apple peut accéder, tout en montrant les pages dans les résultats de recherche en série et les projecteurs de localisation.

d’autre part, de nombreuses autres entreprises d’IA, telles qu’OpenIA, bien qu’avec admis qu’elles suivent les normes éthiques, ne garantissent pas expressément le conformité à robots.txt. Selon la société d’analyse de marché TollBit, au premier trimestre de 2025, il y avait environ 13% de l’activité de récupération de données par des entreprises d’IA qui ignoraient les règles de robots.txt, contre 3,3% au dernier trimestre de 2024.

C’est probablement parce que beaucoup d’Internet disponible sont déjà scrapés pour que l’entreprise poursuive le processus. Même en juin 2025, un tribunal de district américain a décidé que la collecte de données pour la formation à l’IA était légale.

Tout navigateur Web, y compris le bt d’Apple, s’identifie lors de l’accès au site. Si un site ne connaît pas le bt d’Apple, le bt d’Apple suivra les règles applicables au bt de Google en tant que norme de remplacement.

, parmi les principaux éditeurs tels que la BBC ont bloqué l’accès à l’IA tels que OpenAI et General Crawl sur son site. Une étude menée sur 1 156 éditeurs d’informations a révélé que 626 d’entre eux bloquaient la collecte de données par l’IA.

il y a aussi des cas comme Perplexity.ai, qui devraient être achetés par Apple, qui prétend également être uneIA éthique. Cependant, Perplexity a été accusé d’emporter les données sans autorisation et son PDG a admis que leurs systèmes ne sont pas parfaits.

, à ce jour, Apple n’a jamais été légalement accusé de violation de l’éthique ou des droits d’auteur dans sa formation en matière d’IA. Cela contraste avec OpenAI et Microsoft qui ont fait face à des poursuites, ainsi que Perplexity critiqué.

ne signifie pas que les éditeurs soient vraiment satisfaits de la formation à modèles de grande langue utilisant leurs données, mais jusqu’à présent, Apple semble être la seule entreprise à suivre une formation à l’IA régulièrement et éthiquement.

The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)

Tag: apple apple intelligence artificial intelligence