Des pionniers de l’apprentissage par renforcement critiquent sévèrement l’IA « dangereuse »

Des Pionniers De L'apprentissage Par Renforcement Critiquent Sévèrement L'ia "dangereuse"

Richard Sutton et Andrew Barto, pionniers de l’apprentissage par renforcement, se sont récemment expressés contre l’utilisation irresponsable de leurs découvertes par les entreprises d’IA. Lauréats du Turing Award, ils mettent en garde contre la commercialisation des technologies potentiellement dangereuses telles que ChatGPT, perçue comme un outil lucratif sans réel progrès vers l’intelligence générale artificielle.

Qui sont-ils ? Richard Sutton et Andrew Barto sont des pionniers de l’apprentissage par renforcement, une technique d’apprentissage automatique utilisée par les modèles modernes d’IA. Sutton est souvent qualifié de « père de l’apprentissage par renforcement » et enseigne à l’Université de l’Alberta. Barto est professeur émérite à l’Université du Massachusetts. Ces deux scientifiques ne sont pas particulièrement ravis de la manière dont les entreprises d’IA appliquent leur travail de vie.

Richard Sutton et Andrew Barto ont remporté le prix Turing de cette année, considéré comme le prix Nobel de l’informatique, pour leurs contributions significatives au développement de l’apprentissage automatique. Les deux chercheurs se prononcent désormais contre OpenAI, Google et d’autres entreprises d’IA qui publient des logiciels potentiellement dangereux pour les clients finaux. Ils ont critiqué ChatGPT, le qualifiant de simple machine à fric qui ne produira jamais une véritable intelligence générale artificielle (AGI).

Sutton et Barto ont développé l’apprentissage par renforcement (RL) dans les années 1980, inspirés par la psychologie béhavioriste. L’apprentissage par renforcement est l’un des trois paradigmes de base de l’apprentissage automatique, aux côtés de l’apprentissage supervisé et non supervisé. L’apprentissage par renforcement enseigne aux agents d’IA, par essais et erreurs, à prendre des décisions qui atteignent les résultats les plus optimaux, similaire à la manière dont les humains apprennent.

OpenAI, Google et d’autres entreprises construisent leurs plateformes d’IA avec le RL. Le Financial Times note que Barto pense que rendre ce type de logiciel d’IA accessible à des millions de personnes sans protections adéquates est fondamentalement erroné. Utilisant une métaphore, Sutton et Barto ont souligné que la plupart, voire toutes, les entreprises d’IA construisent un pont et testent son intégrité structurelle en l’ouvrant au public.

Des pionniers de lapprentissage par renforcement critiquent severement lIA dangereuse

Barto affirme que de bonnes pratiques d’ingénierie suggèrent que les développeurs essaient de mitiger les conséquences négatives de la technologie. Ni OpenAI ni aucune autre entreprise axée sur l’IA ne le fait. Les modèles d’IA actuels commettent des erreurs, hallucinent des « faits » non existants avec une confiance binaire, mais les entreprises derrière eux collectent des milliards € lors de campagnes de financement sans précédent.

« L’idée d’avoir de grands centres de données et de facturer un certain montant pour utiliser le logiciel motive les choses, et cela n’est pas le motif que je soutiendrais, » a déclaré Barto.

Les entreprises à but lucratif ne cherchent que des opportunités de profits. L’éventualité qu’une d’entre elles apporte la première (AGI) dans le monde n’est qu’une question de droits de vantardise ; même ceux-là sont exploités pour booster les ventes.

Les partisans de l’AGI pensent que ce genre d’intelligence numérique surhumaine est presque là et que cela révolutionnera la technologie et tout le reste. Sutton a suggéré que l’AGI n’est qu’un mot à la mode pour les campagnes marketing. Barto a remarqué que les entreprises développant l’IA doivent acquérir une meilleure compréhension du fonctionnement de l’esprit humain avant de pouvoir construire des systèmes avec une intelligence humaine.