En bref : De nombreuses personnes sont préoccupées par les progrès de l’IA, en particulier lorsqu’il s’agit de créer des machines plus intelligentes que les humains. Même le créateur de ChatGPT, OpenAI, est conscient des dangers potentiels de la superintelligence, y compris l’extinction de la race humaine, et a mis sur pied une équipe pour atténuer ces risques.
OpenAI écrit que le contrôle de systèmes d’IA beaucoup plus intelligents que les humains nécessite des percées scientifiques et techniques pour les diriger et les contrôler. Pour résoudre ce problème d’ici quatre ans, l’OpenAI crée une nouvelle équipe et consacre 20 % des ressources informatiques qu’elle a obtenues à cet effort.
L’OpenAI estime que la superintelligence sera la technologie la plus importante jamais inventée et qu’elle pourrait contribuer à résoudre de nombreux problèmes dans le monde. Mais son immense puissance pourrait aussi être dangereuse, conduisant à la déresponsabilisation de l’humanité, voire à son extinction. Une telle IA peut sembler très lointaine, mais l’entreprise pense qu’elle pourrait voir le jour au cours de cette décennie.
« Actuellement, nous n’avons pas de solution pour diriger ou contrôler une IA potentiellement superintelligente, et pour l’empêcher de s’égarer », écrivent Ilya Sutskever, cofondateur d’OpenAI, et Jan Leike, co-responsable de la nouvelle équipe.
Étant donné que les humains ne seront pas en mesure de superviser des systèmes d’IA beaucoup plus intelligents que nous, et que les techniques d’alignement actuelles ne seront pas adaptées à la superintelligence, de nouvelles percées sont nécessaires.

L’objectif de l’équipe superalignment est de construire un « chercheur d’alignement automatisé de niveau humain ». La recherche d’alignement consiste à s’assurer que l’IA est alignée sur les valeurs humaines et qu’elle suit les intentions de l’homme. L’objectif est de former des systèmes d’IA en utilisant le retour d’information humain, puis de former des IA qui peuvent aider à évaluer d’autres systèmes d’IA, et enfin de construire une IA capable d’effectuer des recherches d’alignement plus rapidement et mieux que les humains.
OpenAI admet que résoudre les défis techniques de la superintelligence en quatre ans est un objectif ambitieux et qu’il n’y a aucune garantie de réussite, mais elle est optimiste. L’entreprise recrute actuellement des chercheurs et des ingénieurs pour rejoindre son équipe.
« L’alignement de la superintelligence est fondamentalement un problème d’apprentissage automatique, et nous pensons que de grands experts en apprentissage automatique – même s’ils ne travaillent pas déjà sur l’alignement – seront essentiels pour le résoudre », expliquent Sutskever et Leike. « Nous prévoyons de partager largement les fruits de cet effort et considérons la contribution à l’alignement et à la sécurité des modèles non-OpenAI comme une partie importante de notre travail. »
Nous avons vu de nombreux communiqués inquiétants sur l’évolution de l’IA, y compris l’un des « parrains de l’IA », Geoffrey Hinton, qui a quitté Google en avertissant que les entreprises qui tirent parti de systèmes d’IA plus puissants deviennent de plus en plus dangereuses.
Le patron d’OpenAI, Sam Altman, est l’un des nombreux experts qui ont récemment mis en garde contre la possibilité que l’IA provoque l’extinction de la race humaine, comparant ces systèmes aux risques posés par la guerre nucléaire et les pandémies. Plus de deux tiers des Américains s’inquiètent de la menace qu’elle fait peser sur la civilisation, et Warren Buffett a comparé la création de l’IA à la bombe atomique.
Mais tout le monde ne partage pas ces craintes. Le professeur Yann LeCun, directeur scientifique de Meta et l’un des trois parrains de l’IA, a déclaré que les mises en garde contre une menace de l’IA pour l’humanité étaient « ridicules ».
Découvrez le reportage du mois (sous-titré en français), l’IA gagnera t-elle face aux champion du monde du jeu de Go ? :

