À mesure que les systèmes d’IA s’intègrent dans la société, une nouvelle question se pose : peuvent-ils améliorer nos vies au-delà des tâches techniques et créatives ? Peuvent-ils aider l’humanité à prendre de meilleures décisions, nous rendre moins égoïstes et favoriser une meilleure coopération ?
Une étude récente menée par les chercheurs Arend Hintze et Christoph Adami examine précisément cette question dans leur article intitulé « Promoting Cooperation in the Public Goods Game Using Artificial Intelligence Agents », publié dans npj Complexity.
La tragédie des biens communs
La tragédie des biens communs est une théorie économique où les individus, dans un environnement à ressources partagées et limitées, surexploitent et épuisent la ressource, entraînant la souffrance de l’ensemble du groupe. TedEd propose une vidéo explicative sur cette théorie que je vous recommande. Pour tester leur hypothèse selon laquelle l’IA pourrait améliorer la coopération entre humains, les chercheurs ont utilisé un célèbre jeu de coopération souvent décrit comme un jeu de « biens publics ».

Dans cette expérience, les joueurs peuvent soit contribuer à un pool commun qui bénéficie à tous, soit garder leur contribution pour eux. Bien que le groupe soit plus performant lorsque chaque individu contribue, chacun peut choisir de se retenir et de profiter de la récompense collective. Les humains n’ont pas très bien réussi à ce test en agissant selon leurs propres intérêts, sans se considérer comme faisant partie d’un groupe. Les chercheurs ont ensuite introduit des agents d’IA dans l’expérimentation.
Dans le premier scénario, les agents d’IA étaient programmés pour coopérer systématiquement. Cela semblait prometteur, mais n’a pas changé le comportement humain. Les personnes ont continué à agir dans leur propre intérêt. Ajouter des « bons » acteurs au système n’a pas suffi. Dans le deuxième scénario, les joueurs pouvaient contrôler les agents d’IA. Comme on peut l’imaginer, cela a échoué. Les joueurs ont paramétré l’IA pour coopérer tout en choisissant de ne pas coopérer eux-mêmes, déléguant ainsi le bon comportement tout en maximisant leurs gains personnels.

Le troisième scénario a montré des résultats encourageants. Les agents d’IA imitaient le comportement des joueurs avec lesquels ils interagissaient. Si une personne coopérait, l’IA coopérait. Si la personne agissait égoïstement, l’IA imitait ce choix. Cela a créé un puissant système de rétroaction, où la coopération humaine était récompensée par la coopération de l’IA. Cela a permis d’améliorer la coopération entre les joueurs humains.
Quel rapport avec les voitures autonomes ?

Bien que l’étude soit limitée et simplifiée pour avoir un effet dans le monde réel, les chercheurs estiment que ce travail peut s’appliquer à plusieurs scénarios, y compris les voitures autonomes. Par exemple, les voitures autonomes pourraient être conçues pour récompenser la conduite coopérative sans nécessairement suivre des règles strictes. Si un nombre suffisant de voitures autonomes adopte cette fonctionnalité, elles pourraient créer une boucle de rétroaction positive bénéfique pour tous.
L’IA ne peut pas éliminer magiquement l’égoïsme. Toutefois, elle peut offrir suffisamment d’incitations pour faire de la coopération le choix le plus judicieux, notamment dans le cadre des véhicules électriques. Des résultats publiés dans le journal Transportation Research proposent également un système intégré pour le routage et le mouvement coordonné des véhicules inoccupés afin de mieux servir les passagers. Une autre recherche, publiée dans le journal Robotics, propose un système de suivi sans collision et de connectivité visuelle entre véhicules autonomes.
Ce principe pourrait également être utilisé pour planifier le chargement des voitures électriques autonomes afin qu’elles puissent éviter les longues attentes et le stress sur le réseau électrique, comme le détaille cet article. Les systèmes d’IA, y compris les chatbots comme ChatGPT et Gemini, suivent déjà un système basé sur les récompenses pour apprendre et améliorer leurs performances, et il semble que ce système pourrait également résoudre des problèmes réels de robotaxi lorsqu’ils entreront lentement dans le courant dominant.
