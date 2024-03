Intelligence artificielle (IA)

Dans le monde universitaire concurrentiel, tout outil permettant aux chercheurs de produire plus de publications est une proposition très intéressante, mais qui risque de conduire à des résultats peu fiables.

« Nous l’utilisons tous. Mais pas de cette manière », a déclaré Andrea (le nom est fictif), un chercheur universitaire qui a choisi de rester anonyme. « J’ai vu il y a quelques jours le premier article dont les phrases ont été copiées et collées à partir de ChatGPT, il a été publié sur Reddit, puis un autre est sorti hier. C’est très grave », a-t-il expliqué à Netcost-security.fr. Les articles ont été publiés par deux équipes de chercheurs différentes, l’une chinoise et l’autre israélienne. Nous avons trouvé trois autres cas. Ce qui a trahi l’intervention des machines, ce sont les formulations standard du chatbot. En effet, les articles contiennent les phrases : « Je n’ai pas accès aux données en temps réel » (le chatbot est mis à jour jusqu’en janvier 2022) et « Bien sûr. Voici une possible introduction pour ton sujet. »

« Je dois dire que j’utilise également ChatGPT », a ajouté Federico, un autre chercheur qui a demandé à préserver son anonymat. « Les articles scientifiques sont composés de différentes sections, ChatGPT est généralement utilisé dans les parties très générales telles que les introductions, où aucune nouvelle n’est ajoutée, donc ça va, cela accélère le travail et l’écrit dans un langage simple et fluide. Parfois aussi dans les parties de travaux connexes, où vous résumez les travaux déjà présents dans la littérature sur un sujet donné. Ou pour paraphraser notre propre texte. Pour le reste, ça ne doit pas être utilisé. » De plus, comme l’explique Andrea, ChatGPT est un excellent assistant pour les traductions, « si vous n’êtes pas un groupe anglais ou américain, donc si votre langue maternelle n’est pas l’anglais, vous l’utilisez pour corriger les erreurs, peut-être même pour rendre le texte plus fluide en anglais. »

Mais dans les cas partagés sur Reddit, l’intelligence artificielle a été utilisée pour écrire les articles. « Dans le texte de l’équipe israélienne, ils ont utilisé le chatbot pour écrire la dernière phrase de la discussion, c’est celle qui, avec la conclusion, est la partie la plus importante », souligne Andrea. « Il est très grave qu’il soit utilisé pour écrire des parties de discussion. Parce que si c’était juste pour traduire, cela irait, mais ainsi la validité des données présentées est remise en question. Et il s’agit d’un article. Malheureusement, de telles pratiques jettent également une ombre sur les données présentées par d’autres centres plus sérieux, car les personnes vont naturellement se demander si tout le monde le fait de la même manière. »

Les articles ont été publiés dans des revues officielles. Les deux articles sont parus dans Elsevier NV, une maison d’édition néerlandaise spécialisée dans les domaines médical et scientifique. « Il est vrai que c’est très important, mais Elsevier est également une grande maison d’édition qui comprend de nombreuses revues », explique Andrea. L’article chinois est apparu dans Surfaces and Interfaces, « il s’agit d’une sous-section ayant un facteur d’impact de 6,2, et il faut savoir qu’après 5, les revues sont considérées très bonnes, donc c’est assez alarmant. »

L’article israélien, quant à lui, a été publié dans Radiology Case Reports, « dans ce cas, il s’agit d’une revue moins fiable et prestigieuse, avec un Citescore de 1 ».

Un autre problème s’est posé lors de la relecture par les pairs. Pour publier chez Elsevier, les chercheurs doivent respecter une série de règles, notamment indiquer s’ils ont utilisé des outils d’intelligence artificielle pour la rédaction de l’article. « Souvent, cela n’est pas mentionné, car de nombreux chercheurs ne savent pas qu’ils doivent citer l’IA, d’autres pensent que ce n’est pas nécessaire en reformulant », explique Federico.

La situation est aggravée par le manque de rigueur des chercheurs qui ont oublié de supprimer des parties entières de texte copiées et collées à partir de ChatGPT. De plus, les erreurs n’ont pas été détectées lors de la relecture par les pairs, qui est une pratique essentielle pour la recherche scientifique car elle permet de filtrer uniquement les articles basés sur des fondements scientifiques.

Dans le monde universitaire concurrentiel, tout outil permettant aux chercheurs de « produire plus de publications sera une proposition très intéressante », explique le chercheur en innovation numérique Savvas Papagiannidis de l’Université de Newcastle, au Royaume-Unis, dans une interview pour Nature. Dans un sondage réalisé par Nature en 2023 auprès de plus de 1600 scientifiques, près de 30% ont déclaré avoir utilisé des outils d’intelligence artificielle générative pour les aider à rédiger des manuscrits, et environ 15% ont déclaré les avoir utilisés pour rédiger des demandes de subvention.

Selon le sondage, 55% des chercheurs estiment que l’un des principaux avantages de l’intelligence artificielle générative est sa capacité à modifier et traduire les textes. Cependant, les chatbots sont encore imprécis, non mis à jour et peuvent générer des informations fausses, également appelées hallucinations.