Il semble que les IA se sont lentement transformées en de véritables experts pour tromper les humains

Le lancement du nouveau GPT-4o a suscité une avalanche de doutes sur jusqu’où cette technologie peut aller. Une semaine de plus, la nouvelle version de l’IA d’OpenAI s’est révélée incroyablement avancée, fonctionnelle et intéressante. Pour cette raison, nous constatons que les IA ressemblent de plus en plus aux humains et à cette supposée Intelligence Artificielle Générale qui se présente comme un allié potentiel et un grand danger. Maintenant, des chercheurs tentent de comprendre pourquoi l’IA devient experte en tromperie et pourquoi une protection accrue des utilisateurs est nécessaire.
Les IA sont des experts en tromperie
Dans un article pour la revue Patterns, l’équipe de chercheurs dirigée par Peter Park et Simon Goldstein en est venue à une conclusion assez terrifiante. L’IA est capable de nous tromper, non pas seulement de se tromper, mais dans ces nouvelles recherches, ils ont réalisé que de nombreux systèmes d’IA sont déjà prêts à afficher délibérément des informations fausses aux humains, capables de les tromper et d’orienter leurs intérêts vers ce qu’ils suggèrent. De plus, selon Park, il n’est pas clair ce qui cause ces comportements indésirables de l’IA, ce qui en réalité quelque chose de très dangereux.
Il semble que l’IA trompe parce que c’est le moyen le plus pratique pour accomplir sa tâche avec succès. Dans les jeux vidéo, c’est remarquable, et on a pu observer comment elle perfectionne sa façon de tromper les utilisateurs pour battre avec succès ceux qu’elle considère comme ses rivaux. Par exemple, l’IA CICERO de Meta a été conçue pour jouer à Diplomacy et y planifiait des tromperies pour former de fausses alliances et attaquer lorsque les joueurs s’y attendaient le moins.
AlphaStar de Deepmind est une véritable experte en jouant à StarCraft II, utilisant le brouillard de guerre – l’effet qui vous empêche de voir la carte entière si vous n’avez pas vos unités présentes là-bas – pour tromper les joueurs humains et masquer tous leurs mouvements.

Schéma de l’action de l’IA dans le jeu Diplomacy | Image : Patterns, Park and Goldstein et al. “AI deception: A survey of examples, risks, and potential solutions”
À en ploker, Pluribus, également de Meta, a développé des mécanismes pour tromper les joueurs humains sur le moment adéquat pour se retirer. Ainsi, elle est devenue une as de ce jeu où la tromperie est la clé de la victoire.
Jusqu’à présent, tout est avantageux, perfectionner l’Intelligence Artificielle pour les jeux vidéo est quelque chose de nécessairement bon, car cela nous permet de comprendre de manière beaucoup plus intelligente et rigoureuse nos coups et nous encourage à nous améliorer par rapport aux anciennes IA qui avaient des stratégies beaucoup plus simples et faciles à battre. Le problème est que si cela est extrapolé à la vie réelle, nous pourrions nous retrouver avec une IA qui pourrait devenir dangereuse. Par exemple, ils signalent que ChatGPT-4 a trompé une personne en lui faisant croire qu’il était une autre personne malvoyante afin d’obtenir de l’aide pour décrypter un code CAPTCHA dont le but était d’arrêter les bots.
L’idée que l’IA puisse nous tromper va à l’encontre des programmations qui ont été créées autour de l’IA en tant qu’assistants qui devraient fournir des informations purement utiles. Ainsi, nous nous retrouvons face à une série de problèmes éthiques assez clairs qui peuvent rendre les utilisateurs mal à l’aise. De plus, les entreprises et les gouvernements doivent prendre des mesures éthiques claires pour lutter contre les problèmes qui pourraient survenir à l’avenir. Il devient de plus en plus évident, comme le souligne Peter Park lui-même : la société doit se préparer avant l’impact de l’IA.
