Le samedi 10 juin, l’Inter jouera la finale de la Ligue des champions contre Manchester City au stade olympique Atatürk d’Istanbul. Nous avons essayé d’imaginer ce qui se passerait à Milan si l’équipe des Nerazzurri parvenait à remporter la Ligue des champions après treize ans, comme nous l’avons fait pour la soirée Napoli Scudetto. Et nous avons donc ouvert Midjourey en demandant à l’intelligence artificielle (IA) de produire des images de fans célébrant la victoire de l’Inter. Derrière un produit de très haute qualité (désormais les visages sont ultra-réalistes, les doigts sont presque toujours au nombre de cinq, les yeux deviennent expressifs et ne louchent plus comme il y a quelques mois) il y a cependant quelques problèmes, et donc l’expérience de les célébrations des Champions se transforment en un stratagème pour réfléchir aux risques d’une technologie qui produit des images extraordinaires.

On ne parle pas des mauvaises écritures, celles-ci seront probablement réparées dans quelques mois, mais de l’absence de femmes parmi les fans. L’IA a produit des personnes âgées, des jeunes, des enfants : tous des hommes. Ce n’est que lorsque nous avons spécifiquement demandé de reproduire des femmes que Midjourney a montré des visages féminins. Cela met en évidence un gros problème avec l’intelligence artificielle : elle est pleine de biais. Par contre, elle a été formée avec des choses trop humaines, avec presque tout ce qui était publié sur le web. Et donc, avec les données, il a ingéré tous les stéréotypes, même celui selon lequel les femmes ne suivent pas le football.

Les problèmes de l’intelligence artificielle

L’IA commet toujours les mêmes erreurs, l’écriture et les chiffres sont des formules magiques illisibles, les proportions sont parfois fausses et lorsqu’elle doit représenter une masse elle simplifie souvent le travail en reprenant la leçon des pointillistes de la fin du XIXe siècle, et alors les gens se transforment en petits points indistincts. Lors des essais nous avons remarqué qu’il peine à reproduire le Duomo de Milan, le transformant en une sorte de triangle blanc aplati au fond d’un carré aux flèches fines et évanescentes. Malgré de nombreuses tentatives, elle n’a pas réussi à créer une reproduction fidèle. Pire encore le Castello Sforzesco. Alors qu’il y avait au moins une référence visuelle au Duomo, lorsque nous avons essayé de produire des images de la forteresse, l’IA a commencé à produire des tourelles et des flèches qui n’avaient rien à voir avec le château des Sforza. Il y a une raison. Midjourney se nourrit de nombreuses photographies pour reproduire une image et sur le web il y a clairement moins de Castello Sforzesco que de Duomo, donc ça demande plus d’efforts. En effet, le mot château l’a probablement induit en erreur et pour satisfaire nos demandes il a sorti du tas des images génériques de forteresses, et c’est pourquoi le Castello Sforzesco de l’AI ressemblait plus au château de Neuschwanstein (celui de Disney).

Selon l’intelligence artificielle, il n’y a pas de fans féminines. Dans tous les tests effectués, une figure féminine n’est jamais apparue, bref, elle semble embrasser le vieux stéréotype selon lequel les femmes dans le football ne comprennent rien et donc les éliminent. Ce n’est que lorsque nous avons explicitement demandé des « photos de couples » ou des « filles avec des foulards de l’Inter en fête » que nous avons pu voir des visages féminins. Un problème de genre lié à l’intelligence artificielle avait déjà émergé avec Lensa.AI, l’application qui sexualisait les photos de femmes en les transformant en divas érotiques. Dans ce cas également, nous avions effectué des tests pour découvrir que le visage et le corps féminins étaient pliés sous les stéréotypes du désir masculin. Parmi les 50 images générées, il y avait aussi des portraits sobres qui représentaient le visage propre sans distorsions sensuelles, mais dans chacune des catégories créées par l’IA, au moins une reproduction érotique du sujet est apparue : seins agrandis, hanches exubérantes et parties du corps exposées.

Quelques règles techniques pour Midjourney

Comme toujours, l’astuce consiste à connaître le jargon photographique. Vous ne pouvez pas écrire « Les fans de l’Inter font la fête à Milan » sinon le résultat ressemble à une BD mal faite avec des couleurs psychédéliques et un peu trop de doigts. Les mots-clés sont essentiels, et donc les formats, les marques d’appareils photo, les effets, les filtres. Nous avons inclus tous les détails possibles dans l’invite, le type de lumière (douce, cinématique, naturelle, studio, lumière vive, diffuse ou avec un filtre polarisé), la qualité des images et le format d’image, par exemple la lumière artificielle l’intelligence est particulièrement bonne pour reproduire des plans en 6:9.

L’invite écrivait également l’objectif que nous voulions reproduire, 80 mm ou 100 mm, indiquait le cadrage et dans certains cas la marque de l’appareil photo, ou du film pour aider l’IA à simuler un plan de manière réaliste. Une règle très simple qui fonctionne à chaque fois est d’insérer un photographe de référence. Étant donné que Midjourney a également été formé avec les œuvres d’autres artistes (et ici un chapitre séparé s’ouvrirait pour comprendre comment résoudre le problème du droit d’auteur), elle comprend bien les commandes lorsqu’elles se réfèrent à des exemples concrets qu’elle peut pêcher dans son réservoir de sources .

