Les chercheurs exhortent les gouvernements à concevoir de nouvelles lois sur la sécurité de l’IA. Cependant, une question reste en suspens : les robots devraient-ils toujours dire la vérité ? Nous entrons ici dans le domaine de l’éthique. Jusqu’à présent, la réponse semblait évidente, mais quelques exemples pratiques suffisent à soulever de nouveaux doutes.

N’importe quel idiot peut dire la vérité. Mais mentir demande de l’intelligence, écrivait Baltasar Graciàn, philosophe et écrivain espagnol. Cette règle s’applique également lorsque l’intelligence en question est artificielle. Selon un nouvel article scientifique intitulé « AI Deceptions: A Study of Examples, Risks and Potential Solutions » publié dans la revue Patterns, les machines peuvent mentir. Nous ne parlons pas des hallucinations de l’intelligence artificielle (les erreurs, les répétitions ou les phrases inventées par les logiciels), mais de manipulation.
L’étude du Massachusetts Institute of Technology (MIT) a identifié les compliments, les mensonges et les omissions. Comme l’expliquent les chercheurs, les robots ne sont pas conscients, mais ils cherchent le meilleur moyen d’atteindre un objectif. Et comme l’Histoire l’enseigne, le mensonge fait partie du processus. « Plus les machines deviennent douées pour mentir, plus les dangers pour la société augmentent », explique Peter Park, chercheur en sécurité de l’IA au MIT et auteur de la recherche.
L’intelligence artificielle Cicero
Les chercheurs ont analysé Cicero, une intelligence artificielle de Meta. L’IA parvient à atteindre des performances humaines dans le jeu de stratégie Diplomacy, similaire à Risiko, où il est nécessaire d’établir des alliances avec d’autres joueurs pour attaquer, se défendre ou tendre des embuscades.
« Nous avons découvert que l’intelligence artificielle de Meta avait appris à être une maîtresse de la tromperie », a déclaré Park. Dans certains cas, les joueurs ont pris le logiciel pour un humain. D’ailleurs, lorsque celui-ci tardait à répondre, il se justifiait en disant : « Je suis au téléphone avec ma petite amie ».
Non seulement Cicero
Cicero est l’exemple parfait, comme l’explique Park : « Meta a réussi à former avec succès son intelligence artificielle à exceller dans la recherche du pouvoir politique », et pour y parvenir, il faut mentir, dissimuler et négocier avec les autres joueurs. Ce n’est cependant pas le seul cas. L’étude cite également des systèmes d’intelligence artificielle formés pour mener des négociations économiques simulées, qui ont appris à mentir sur leurs préférences.
« Les systèmes d’intelligence artificielle ont également appris à tricher lors des tests de sécurité », et ChatGPT-4 a prétendu être un malvoyant pour être aidé à résoudre un Captcha.
Comment se protéger des intelligences artificielles menteuses
Les chercheurs appellent les gouvernements dans leur étude à élaborer de nouvelles lois sur la sécurité de l’IA « les risques sont nombreux », expliquent-ils, les machines peuvent être utilisées pour tromper les systèmes d’identification, diffuser de fausses informations politiques ou orchestrer des fraudes. L’intelligence artificielle doit être « honnête, disponible et inoffensive », soulignent-ils.
L’UE attribue à chaque système d’IA un niveau de risque, pouvant être minimal, limité, élevé ou inacceptable. Les systèmes à risque inacceptable sont interdits, tandis que les systèmes à haut risque sont soumis à des exigences spéciales. « La tromperie de l’IA présente une large gamme de risques pour la société, donc tous ces cas devraient être traités par défaut comme présentant un risque élevé ou inacceptable », souligne Park.
Est-il juste que les robots ne mentent jamais ?
Enfin, il reste une dernière question en suspens : les robots devraient-ils toujours dire la vérité ? Nous entrons ici dans le domaine de l’éthique. Jusqu’à présent, la réponse semblait évidente, mais quelques exemples pratiques suffisent à soulever de nouveaux doutes.
Imaginons qu’un homme armé pénètre dans une école et demande à une intelligence artificielle où se cache la classe d’enfants. Dans ce cas, la vérité serait un problème, car l’intelligence artificielle devrait mentir pour sauver la classe d’enfants. Le tableau est plus complexe et ne peut être réduit à un dualisme stérile entre la vérité et le mensonge. La législation, qui devra freiner l’IA menteuse, ne peut ignorer une profonde réflexion éthique.
