Partager:

JAKARTA - Une récente étude menée par quatre chercheurs de l’Université allemand de Tubingen et de l’Université nord-ouest a révélé l’impact significatif de l’utilisation de modèles de langue gros (LLM) sur l’écriture scientifique. L’étude, qui utilise une méthode d’analyse de mot excessive, souligne une augmentation de l’utilisation de certains mots depuis l’introduction du droit d’accord vers la fin de 2022.

L’étude a été menée en analysant plus de 14 millions d’abstrats d’articles publiés dans pubmed entre 2010 et 2024. Les chercheurs ont comparé la fréquence relative des mots avant et après l’ère de la LM pour identifier les changements dans le choix de vocabulaire. Les résultats ont montré qu’un certain nombre de mots tels que « Delves », « showcasing » et « bawahcores », qui étaient auparavant rarement utilisés, ont connu une augmentation significative de l’utilisation après que les droits de vote sont devenus plus courants utilisés.

Le Dr Andreas Mueller, l’un des principaux chercheurs de l’Université de Tubingen, a expliqué que cette augmentation indiquait l’utilisation du droit d’auteur dans le processus d’écriture scientifique abstrak. « Nous avons constaté qu’au moins 10% des abstrakts publiés en 2024 utilisent le droit d’auteur dans le processus », a-t-il déclaré. Ces résultats soulignent l’importance de détecter l’utilisation du droit d’auteur parce que bien que le texte résultant puisse être humain, ils ont le potentiel de contenir des références inexactes ou de fausses déclarations.

L’étude a également comparé l’augmentation de l’utilisation des mots post-LLM avec l’augmentation des mots lors d’événements de santé mondiaux importants tels que la pandémie de COVID-19. Le Dr Muhler a expliqué qu’avant l’ère de la LM, l’augmentation des mots était généralement liée à de grands événements mondiaux tels que le virus Ebola en 2015 et la pandémie de COVID-19 de 2020 à 2022. Cependant, l’augmentation des mots post-LLM tend à se concentrer sur des mots de style tels que les mots de travail, les mots de nature et les mots de légende.

Bien qu’une utilisation accrue de ces mots de mots puisse se produire naturellement dans l’évolution des langues, les chercheurs ont souligné que le pic soudain et significatif tels que celui-ci était rarement observé avant l’ère du MHP. Ils ont également noté que l’utilisation de MHP pourrait être plus courante parmi les auteurs non autochtones qui nécessitent une assistance dans la rédaction de texte en anglais.

Ces découvertes ouvrent le chemin pour une meilleure capacité des humains à détecter et à supprimer des mots de style inhabituels du texte produit par les juridiques. Les chercheurs espèrent que la connaissance des mots de marqueur de juridique permettra aux éditeurs humains d’être plus efficace dans le filtrage des textes généraires avant de se propager dans la communauté scientifique mondiale.

L’étude a été publiée sous forme de pré-publique plus tôt ce mois-ci et devrait encourager une discussion supplémentaire sur l’impact des technologies génératives d’IA sur la communication scientifique moderne.


The English, Chinese, Japanese, Arabic, and French versions are automatically generated by the AI. So there may still be inaccuracies in translating, please always see Indonesian as our main language. (system supported by DigitalSiber.id)