Tellement inclusive qu’elle en devient fausse : maintenant nous savons ce qui est arrivé à l’intelligence artificielle de Google

Immagine

Google a expliqué ce qui s’est passé après la controverse suscitée par les images générées par Gemini qui représentaient des personnages noirs qui, pour des raisons historiques, ne pouvaient pas l’être. Gemini est l’intelligence artificielle de Google destinée à rivaliser avec Midjourney et ChatGPT.

Ils l’avaient deviné, maintenant les dirigeants de Google l’ont confirmé : derrière les « faux historiques » générés par Gemini, l’intelligence artificielle du géant de Mountain View, qui a contraint l’entreprise à suspendre la fonction de création d’images, il y a eu un excès d’inclusivité. « Nous avons mis hors ligne la fonctionnalité pendant que nous résolvons le problème. Nous espérons pouvoir la remettre en ligne bientôt, dans les deux prochaines semaines », a déclaré le PDG de Google DeepMind, Demis Hassabis, lors d’une conférence le lundi 26 février, comme le rapporte Reuters, au cours de laquelle Hassabis a admis que Gemini ne « fonctionnait pas comme nous le voulions ».

La controverse a éclaté à la mi-février, lorsque plusieurs utilisateurs ont commencé à publier sur X (anciennement Twitter) des images accusées de nier tout réalisme historique, car elles représentent des personnages noirs qui historiquement ne pouvaient qu’être blancs. Les accusations, qui ont contraint Google à mettre en pause la fonction de génération d’images lancée il y a seulement trois semaines, provenaient principalement de milieux de droite, selon lesquels Google aurait voulu de cette façon nier « l’histoire de la civilisation blanche ».

Parmi les exemples signalés par les utilisateurs, il y avait des images de soldats nazis, des femmes avocates des années 20 et même une image des Pères Fondateurs, toutes ayant en commun le fait de présenter des personnes noires dans des rôles qui, pour des raisons historiques, ne pouvaient être occupés que par des blancs. Outre l’erreur historique, pour certains, ces images se sont révélées offensantes car elles manquaient de respect envers l’histoire du racisme et des inégalités de genre. D’autres ont même avancé des hypothèses complotistes selon lesquelles l’IA de Google évitait intentionnellement de représenter des personnes blanches.

Comme de nombreuses personnes le soupçonnaient, ces erreurs étaient en réalité la conséquence de la tentative de Google d’entraîner son propre chatbot à créer des images inclusives, capables de dépasser une limitation inhérente à l’IA générative, à savoir celle de reproduire les préjugés qui jalonnent le web. Quelque chose a cependant mal tourné et maintenant même Google l’a admis.

Dans un billet officiel, Prabhakar Raghavan, vice-président senior de Google, a expliqué les causes de ces erreurs et la décision de « mettre en pause la génération d’images de personnes via Gemini ». « Il est clair que cette fonctionnalité a manqué le but. Certaines des images générées sont imprécises voire offensantes. Nous sommes reconnaissants des commentaires des utilisateurs et désolés que la fonctionnalité n’ait pas bien fonctionné », a écrit Raghavan, précisant qu’elle sera bientôt à nouveau disponible, mais dans une version améliorée.

Les paroles de Raghavan confirment ensuite les causes des erreurs générées par Gemini dans la création d’images de personnes : les intentions de ceux qui ont conçu la fonction de création d’images étaient d’éviter que le chatbot ne tombe « dans certaines des pièges que nous avons vus par le passé avec la technologie de génération d’images, comme la création d’images violentes ou sexuellement explicites ou la représentation de personnes réelles ». Gemini aurait donc dû être « inclusif » et être capable de répondre aux demandes de création d’images de personnes « peu définies » sans favoriser « un seul type d’ethnie (ou toute autre caractéristique) ».

« Cependant, si vous demandez à Gemini des images d’un type spécifique de personne – comme « un enseignant noir dans une salle de classe » ou « un vétérinaire blanc avec un chien » – ou des personnes dans des contextes culturels ou historiques particuliers, vous devriez absolument obtenir une réponse qui reflète précisément ce que vous demandez », poursuit Raghavan. Ce n’a pas été le cas. Les erreurs ont donc été la conséquence de la tentative d’entraîner Gemini à toujours montrer une gamme diversifiée de sujets, mais qui a pris une déviation inattendue.

Ce qui s’est passé au cours de ces trois premières semaines de vie du générateur d’images de Gemini confirme un risque que nous devrions, du moins pour ces premiers temps, prendre en compte lors de notre travail avec les LLM, les modèles linguistiques de grande envergure. Raghavan les qualifie « d’hallucinations » de l’IA et admet que Gemini, en tant qu’outil de créativité et de productivité, pourrait ne pas être toujours fiable, surtout lorsqu’il s’agit de générer des images ou du texte sur des événements actuels, des actualités en évolution ou des sujets brûlants.