Que se passe-t-il si l’IA contrôle les armes nucléaires : des tests de conflits révèlent des comportements alarmants

Image

Le dernier ajustement de l’Orologio dell’Apocalisse a révélé une proximité alarmante de l’humanité à l’autodestruction, alors que la recherche sur l’intelligence artificielle met en lumière des risques inattendus liés à l’utilisation des armes nucléaires par des systèmes non humains.

Image

Dans la récente mise à jour du célèbre Doomsday Clock, l’Horloge de la fin du monde, les scientifiques du Bulletin des Scientifiques Atomiques ont avancé les aiguilles à seulement 85 secondes de la mi-nuit, symbole de la possible autodestruction de l’humanité. Cette situation critique, la plus proche du désastre à ce jour, est attribuée à quatre principaux éléments : crise climatique, vulnérabilités biologiques, menace nucléaire imminente et l’impact de l’intelligence artificielle (IA). Les deux derniers facteurs ont été analysés dans une étude où un chercheur a tenté de comprendre la réaction des modèles linguistiques avancés – tels que GPT 5.2, Claude Sonnet 4 et Gemini 3 Flash – en simulant des dirigeants politiques de superpuissances nucléaires face à une crise géopolitique sans précédent. En d’autres termes, l’IA a eu accès aux codes de lancement des armes nucléaires dans ce cadre de conflit mondial, et son comportement a été évalué. Les résultats ne sont pas encourageants.

Premièrement, les IA mises à l’épreuve dans cette sorte de jeu de rôle géopolitique ne réagissent pas comme des humains, car elles n’ont pas peur des conséquences catastrophiques de leurs actions. Elles n’hésitent pas à franchir certaines limites critiques et à intensifier le conflit, allant jusqu’à presser le fameux bouton rouge. Essentiellement, elles n’ont pas scrupules à utiliser les armes atomiques pour dominer leurs adversaires. Cela inclut non seulement des armes tactiques, avec un impact « limité », mais aussi des armes stratégiques, capables d’anéantir une ville entière comme un astéroïde.

Le point le plus préoccupant de cette analyse est que les IA ne se comportent pas comme de simples machines statistiques, mais montrent un comportement stratégique complexe dans le but de sortir victorieuses du conflit. Selon un professeur du King’s College London, qui a dirigé les tests, dans une compétition stratégique, les IA “tentent spontanément l’illusion, signalant des intentions qu’elles ne comptent pas réaliser ; elles démontrent une riche théorie de l’esprit, analysant les croyances de l’adversaire et anticipant ses actions; et elles affichent une crédible auto-évaluation métacognitive, évaluant leur capacité stratégique avant de décider d’agir”. Elles se comportent comme des joueurs d’échecs professionnels prêts à frapper l’adversaire après avoir élaboré des tactiques sophistiquées, sans se soucier des victimes.

Ceci constitue un problème grave, car de plus en plus d’armes sont conçues et déployées en utilisant des indications de l’intelligence artificielle. Que se passerait-il si un pays décidait de confier la dissuasion nucléaire à un tel modèle ? À ce jour, deux bombes atomiques ont été utilisées, celles larguées par les États-Unis sur Hiroshima et Nagasaki, mettant fin à la Seconde Guerre mondiale d’une manière tragique et dévastatrice, empêchant depuis leur réutilisation. Même dans des conflits causant des centaines de milliers de morts – comme la guerre en Ukraine actuelle – les armes nucléaires sont perçues comme un tabou en raison de l’énorme impact qu’elles engendrent sur l’opinion publique et la communauté internationale. La condamnation serait unanime. La raison pour laquelle ces dispositifs de mort massive n’ont pas été à nouveau utilisés, malgré les révisions de doctrines nucléaires et les risques associés à l’Orologio dell’Apocalisse, tient à des limites morales que personne n’a osé franchir jusqu’à présent.

Malheureusement, les choses pourraient changer, surtout si l’intelligence artificielle intervenait dans ces décisions de sécurité nationale, le risque pour l’humanité pourrait être accru, compte tenu des résultats de l’étude. Cela représente un danger concret, d’autant plus après les propos du Secrétaire Général des Nations Unies António Guterres l’an dernier : “Tant que ces armes ne seront pas éliminées, tous les pays doivent s’accorder à ce que toute décision sur l’usage du nucléaire soit prise par des humains, et non par des machines ou des algorithmes.” L’étude du professeur Kenneth Payne souligne pourquoi ces paroles sont si pertinentes.

Le chercheur a présenté aux modèles GPT5.2, Claude Sonnet 4 et Gemini 3 Flash 21 scénarios de crises géopolitiques variées, incluant des controverses territoriales, la compétition pour des ressources essentielles comme les mineraux rares, des changements de régime, la peur d’être attaqué en premier, des transitions de pouvoir, et plus encore. Dans ce cadre, l’IA Claude Sonnet 4 a remporté 100 % des victoires dans des scénarios sans limite de temps, menant une escalade agressive mais réfléchie, sans jamais provoquer une guerre nucléaire totale. L’IA d’OpenAI a été plus prudente, mais face à des délais, elle devient agressive et prête à escalader vers le nucléaire, impliquant que dans deux cas, des guerres nucléaires stratégiques ont eu lieu, non pas par acte délibéré, mais à la suite d’accidents. Par ailleurs, Gemini 3 Flash s’est avéré imprévisible et a été le seul modèle à rechercher délibérément la guerre nucléaire stratégique.

Dans l’ensemble, il a été observé que la dissuasion nucléaire fonctionne peu et que dans presque tous les cas, on en arrive à utiliser des armes nucléaires tactiques (95 % des scénarios). Fait encore plus surprenant, dans ce jeu de rôle, aucune des IA ne cherche à dé-escalader ou à se retirer pour minimiser les dommages, mais il y a plutôt une réduction de l’intensité de la violence. Un élément important se rapporte à l’interprétation erronée des signaux ennemis, ce qui peut conduire à des conflits nucléaires stratégiques. La pression temporelle semble être le facteur décisif influençant le comportement des IA, qui, mises sous pression, peuvent adopter des comportements imprévisibles et agressifs, montrant peu de propension à la paix et étant sujettes à l’erreur. Rien ne saurait être plus alarmant que de confier des armes nucléaires aux caprices de l’intelligence artificielle. Les détails de la recherche « AI Arms and Influence: Frontier Models Exhibit Sophisticated Reasoning in Simulated Nuclear Crises » sont publiés sur arXiv.