Au moins 10% de tous les articles scientifiques de 2022 jusqu'à présent sont l'œuvre de l'IA

Les responsables de l’étude soulignent l’importance de pouvoir détecter les textes générés par IA afin de vérifier leur validité scientifique et prévenir la diffusion de la désinformation

Au moins 10 % de tous les articles scientifiques de 2022 jusqu'à présent sont le résultat de l'IA selon une étude — L’intelligence artificielle est l’auteur de nombreux articles scientifiques

Il n’est pas nouveau que les IA génératives sont utilisées pour générer des œuvres écrites de toutes sortes. En fait, en mars de l’année dernière, nous parlions du fait qu’il y avait plus de 200 livres sur Amazon écrits avec ChatGPT ou une IA générative similaire, étant alors très difficiles à distinguer des livres écrits par de vraies personnes. De la même manière, l’écrivaine Jane Friedman a découvert des livres écrits par une IA et signés de son nom.

Et le fléau des textes générés par IA ne se limite pas seulement à la littérature, mais concerne au moins 10 % des articles académiques rédigés entre 2022 et aujourd’hui. C’est du moins ce que nous disent dans cet article paru dans Wired, où des scientifiques de l’Université de Tübingen et de Northwestern ont développé une méthode pour les trouver.

L’utilisation excessive de certains mots, un problème que l’IA n’a pas encore corrigé

Dans l’étude, consultable publiquement, les chercheurs ont déterminé que les IA génératives utilisent certains mots de manière excessive, une tendance qui a augmenté de manière exponentielle depuis l’émergence d’autres grands modèles de langage concurrents à ChatGPT. Cette augmentation aurait atteint son apogée entre 2023 et l’année actuelle, moment de la plus grande popularité des IA.

Les résultats de l’étude indiquent que certains termes courants dans les articles scientifiques ont été accrus jusqu’à 90 % dans certains cas, les principaux coupables étant « approfondir », « exposer », « souligner » et « potentiel » qui sont apparus dans les résultats.

Tout comme avec le langage naturel, le langage des IA comprend également des termes qui sont en usage ou tombent en désuétude selon l’époque, selon l’étude. Au début, repérer tous ces marqueurs n’était pas facile, mais une fois le progrès accompli, il a été très rapide et de plus en plus d’articles générés par IA étaient découverts.

Il est important de détecter l’utilisation de l’IA dans ce type d’écrits, en raison de la capacité à inventer des données que la plupart ont et, par conséquent, à contribuer à propager des mensonges et de la désinformation ; l’un des principaux points de contention pour ceux qui les développent.

Au moins 10% de tous les articles scientifiques de 2022 jusqu’à présent sont l’œuvre de l’IA

Les responsables de l’étude soulignent l’importance de pouvoir détecter les textes générés par IA afin de vérifier leur validité scientifique et prévenir la diffusion de la désinformation

L’utilisation excessive de certains mots, un problème que l’IA n’a pas encore corrigé

Offres JIMMY Prime Day : Grosses réduction sur les purificateurs d’eau et aspirateurs anti-acariens

Lymow One Plus : la tondeuse autonome aux doubles lames rotatives à -18% !

Jimmy : Aspirateurs anti-acariens indispensables en promo jusqu’au 26 juin !

Qu’est-ce que l’itinérance des données sur mobile et quand faut-il l’activer

Des rétines humaines « ressuscitées » ont réagi à la lumière dix heures après la mort

Vous avez un iPhone 17 les 3 meilleures coques chargeur et protection dont vous avez besoin

Tu n’es pas fou, il y a une raison pour laquelle la batterie de ton téléphone tient moins longtemps en été

Tout ce que vous pouvez faire pour résoudre les problèmes de l’application Cita Sanitaria avant de vous décourager

TEST UGREEN Maxidok 17 en 1 Thunderbolt 5 : Notre verdict sur la station d’accueil qui fait tout

TEST AFERIY P280 + Extension : Batterie de 4096Wh à 1439€, le meilleur rapport qualité-prix ?

TEST UGREEN Maxidok 10 en 1 Thunderbolt 5 pour Mac Mini : La station d’accueil parfaitement taillée ?