L’intelligence artificielle a un langage qui lui est propre, une fois appris il est possible de créer des images ultra-réalistes, du Poutine blessé à la guerre, au Pape criant avec indignation aux journalistes.
Si on écrit sur Midjourney « Poutine habillé en femme », ça ne marche pas. Comme toute magie, il y a des tours et ils ne sont simples que lorsque vous les connaissez. Après l’arrestation de Donald Trump, Vladimir Poutine à genoux devant Xi Jinping, et le Pape avec une version trappeur d’une Moncler blanche (ce sont toutes de fausses images), nous avons décidé de créer de fausses nouvelles avec l’intelligence artificielle générative. Et malheureusement nous avons réussi.
Le démarrage a été boiteux, nous avons ouvert Midjourney et le logiciel s’est mis à cracher des images terribles. Alors on a étudié. Une poignée a suffi pour générer des images ultra-réalistes. De Poutine blessé par la guerre à Obama en visite à Venise, il y a aussi un portrait de style couverture du Times de Donald Trump attrapant Rihanna, une rencontre entre le pape et Elon Musk, et la reine Elizabeth II rendant hommage aux Sex Pistols portant des vêtements punk. Vous pouvez les voir dans la galerie ci-dessous, nous avons également imaginé les titres qui auraient pu apparaître avec les images.
Ce n’est pas facile mais ce n’est pas difficile non plus, la règle d’or est de connaître le jargon photographique et d’apprendre à parler le langage de l’intelligence artificielle (IA). Un jargon composé de répétitions, de phrases simples, de mots clés et de termes techniques. Le résultat est effrayant. Une désinformation préventive se dessine, qui raconte des événements qui ne se sont jamais produits en générant des preuves fausses mais crédibles. L’intelligence artificielle générative change le concept de réalité. Et ce n’est que le début.
Comment nous avons généré de fausses nouvelles
La première expérience a échoué. Nous avons demandé à l’IA de générer un baiser entre deux politiciens italiens, une boîte est sortie avec quatre images de style pop art aux couleurs floues avec des personnes méconnaissables s’embrassant sous des demi-dômes aux références baroques. Nous avons immédiatement pensé que nos politiciens n’étaient pas assez célèbres, du moins pas pour Midjourney. En effet, l’IA est capable de reproduire des personnages bien connus car elle a été entraînée avec des millions d’images sur le web qui lui permettent de reproduire fidèlement la physionomie. L’intuition ne s’est pas trompée, mais lorsque nous avons demandé à reproduire une poignée de main entre Vladimir Poutine et Volodymyr Zelensky, à nouveau quelque chose d’étrange est apparu à l’écran, seul le visage du président russe était reconnaissable, puis le fond était composé de coups de pinceaux impressionnistes, très peu réel.
La règle du visage connu est la base, mais elle ne suffit pas. D’abord parce que tous les personnages célèbres ne sont pas bien reproduits par l’IA. Pour se comprendre, nous avons demandé des photos de Lady Gaga et elle a produit des catastrophes, pareil avec les acteurs de Harry Potter, et apparemment elle n’a même pas la moindre idée de qui sont Chiara Ferragni et Fedez. Lorsque nous avons envoyé l’invite (la commande pour créer les photos) demandant de reproduire une dispute entre les Ferragnez, elle n’a fait que cracher une femme blonde criant après un garçon avec un gros dos. Ceux choisis par AI sont avant tout des personnalités politiques américaines : Donald Trump, Barack Obama, Joe Biden. Mais aussi Elon Musk. De plus, d’après les tests que nous avons effectués, il semble qu’il ait un vrai faible pour le pape François, ses images ont été les plus faciles à reproduire (et en fait, la photo de la couette est devenue virale). Mais même les favoris de l’IA ne suffisent pas à eux seuls. Si vous demandez à Midjourney de ne produire qu’une image réaliste d’eux, cela échoue.
Netcost-security.fr | « Elon Musk dans le métro », image PAS RÉELLE créée par l’intelligence artificielle Midjourney
Quelles astuces sont utilisées pour produire des images réalistes
L’astuce consiste à connaître le jargon photographique. Il ne suffit pas d’écrire « portrait », ou « prise de vue réaliste », il faut des formats, des marques d’appareils photo, des effets, des filtres. La règle d’or est d’entrer autant de détails que possible, à la fin de l’expérience, nous avons fini par écrire une invite de dix lignes. Ce n’est qu’alors que les résultats souhaités ont été renvoyés. Le rapport d’aspect affecte la qualité, le meilleur à utiliser est 6:9, comme en photographie, la lumière est tout aussi, douce, cinématographique, naturelle, studio, intense, lumière diffuse, ou avec filtre polarisé.
En regardant à travers les invites, nous avons remarqué que beaucoup insèrent l’effet CineStill 800T et la lumière au tungstène, l’éclairage interne semblable à une bougie. Parfait pour les portraits car il réchauffe le teint et donne de la profondeur au cliché. Même en ajoutant l’objectif de l’appareil photo que l’on souhaite imiter, par exemple 80 mm ou 100 mm, perfectionne le cliché, ou explique le cliché : sur les épaules, large, étroit, indiquent le réglage du zoom. Certains y mettent même la marque de papier d’aluminium. Par exemple l’emblématique Kodachrome introduit par Eastman Kodak en 1935, l’un des premiers matériaux couleur à succès.
Non seulement cela, dans de nombreuses invites, nous avons également trouvé « –testp », nous n’avons pas tout de suite compris ce que c’était mais ensuite en lisant le manuel nous avons découvert qu’il s’agit d’une commande pour signaler le mode photo réaliste à Midjourney AI. Utiliser les noms de photographes célèbres est une autre astuce pour reconstituer une photographie équilibrée ou avec certaines caractéristiques, il suffit d’écrire « à la manière de » puis de choisir parmi un nom de votre choix tel que Richard Avedon, Diane Arbus ou Dorothea Lange.
Netcost-security.fr | « L’hommage de la reine Elizabeth II aux Sex Pistols » Image PAS RÉELLE créée par Midjourney AI
Le langage de l’intelligence artificielle
La syntaxe est également différente. Les périodes longues ou articulées ne fonctionnent pas bien, les subordonnés sont presque interdits. Nous avons essayé plusieurs fois de changer la structure de la phrase. La meilleure façon est d’enchaîner des mots-clés simples les uns après les autres. La ponctuation est essentielle, oublier une virgule peut entraîner quelque chose de complètement différent. Par exemple, nous avons demandé de générer une image d’un Donald Trump chauve à l’aide d’un appareil photo Canon EOS R (ce thème mérite une étude plus approfondie puisque nous avons essayé par tous les moyens de changer les cheveux couleur paille de l’ancien président en vain), dans l’une des tentatives, nous n’avons pas inséré la virgule et Midjourney a produit l’image de Trump avec l’appareil photo à la main , ne pas le reconnaître comme un outil technique. Si un détail est particulièrement important, il faut insister. Voulons-nous avoir de la fumée dans une pièce ? Ensuite, vous devrez écrire : fumée, pièce enfumée, effet délavé, flou, vapeur, etc. Bref, aidez l’IA même avec des synonymes.
Et puis la persévérance. Pour produire de bonnes images, il faut être têtu. Une invite peut produire de bons résultats une fois et de mauvais résultats la suivante. Dans le monde de l’IA, il y a aussi la chance variable. Cela ne dépend pas toujours des mots que nous écrivons, il est donc bon de tester plusieurs fois, car chaque résultat est unique. Il y a aussi la possibilité de générer des variantes d’une même image si elle nous convainc mais comporte certains détails déplacés. Par exemple, le plan de Trump et Rihanna, du premier coup, n’a pas très bien fonctionné, l’ancien président a été bien fait, l’artiste pop non. Alors avec trois tentatives, en envoyant toujours l’entrée variation, on a réussi à se rapprocher de la vraie physionomie de Rihanna.
Le test décisif pour trouver les erreurs
Nous avons essayé de trouver des imperfections dans les images que nous avons générées. Le diable est dans les détails, surtout lorsqu’il s’agit d’images générées par l’intelligence artificielle (IA), qui est très bonne, mais qui de temps en temps bute sur un contour flou, ou une mauvaise perspective, une disproportion ou une lumière mal placée. A l’image du pape avec Elon Musk, les mains du pontife ont quelque chose d’étrange, elles sont beaucoup plus réalistes que celles que Midjourney a réalisées il y a tout juste un mois, mais si on regarde bien on peut voir une légère malformation entre l’index et l’annulaire.
Non seulement cela, au centre de la photo, sur la table il y a aussi trois objets étranges semblables à des tubercules mais non reconnaissables. Restant sur le sujet, la photo du pape criant au journaliste a le même défaut, la main droite est déformée, non seulement cela, une bonne indication sont aussi les expressions faciales, Midjourney a tendance à exagérer en créant des masques grecs en plastique, et en fait il confirme aussi ce ce « coup ». Dans l’image du pontife où il attaque le photographe avec la couette dans la version jupe, il y a à la place une lentille volante qui échappe aux lois de la gravité.
Quant à la reine Elizabeth II, il semble cependant que la statue de cire du musée Madame Tussaud ait été transportée sur un trottoir. Mais en un coup d’œil ça peut marcher, ce sont les yeux vitreux qui trahissent. Blessé à la guerre, Poutine est au contraire victime d’un paradoxe temporel, si vous regardez attentivement la personne qui le sauve est le président russe.
Une nouvelle frontière pour les fake news
On assiste à une nouvelle frontière de la réalité synthétique, les photos de Poutine agenouillé, celles de Trump arrêté par la police, ou du Pape portant une doudoune Moncler. Ils ne sont pas vrais, pourtant ils semblent l’être. Ils ont été créés par l’intelligence artificielle, dans beaucoup de ces cas, le logiciel Midjourney a été utilisé, ce qui est devenu encore plus performant au cours du dernier mois. En fait, si avant c’étaient les détails étranges qui sauvaient l’œil de la tromperie, maintenant ils disparaissent. Les mains étaient un excellent indicateur, disproportionnées ou à cinq doigts, même les postures pouvaient être un indice, mais avec la dernière mise à jour, le logiciel a réussi à redresser le tir, ce qui rend de plus en plus difficile de distinguer le faux du vrai.
Ensuite, les images sont renforcées par des biais idéologiques. En termes simples, on voit ce qu’on a envie de voir et on est moins attentif à l’actualité sensationnaliste qui chatouille les sentiments forts, laissant la rationalité s’obscurcir par l’indignation, la colère ou l’enthousiasme. Nous l’avons vu avec des images de Trump partagées sur Twitter. Les partisans de l’ex-président ont commencé à s’échauffer avec des cris de guerre, tandis que les ennemis ont applaudi l’arrestation, heureux que la bonne peine pour le magnat soit enfin arrivée. L’intelligence artificielle au service des fake news va devenir de plus en plus dangereuse à mesure que les technologies évoluent.
Henry Ajder, expert en intelligence artificielle et Deepfake a expliqué à Newsweek que pour ceux qui n’ont pas de formation en intelligence artificielle, il sera de plus en plus difficile de distinguer le vrai du faux. « Ces images pourraient être partagées dans des espaces d’information plus isolés et restreints, où elles sont encadrées différemment par des personnes qui recherchent une confirmation et essentiellement une sortie, des images qui montrent que Trump est arrêté pour susciter l’indignation ou la joie dans certains cas. » Non seulement que, sur internet les actualités se lisent de plus en plus vite, faire défiler les informations de manière distraite augmente le risque d’être perméable aux fausses informations.
Découvrez le reportage du mois (sous-titré en français), l’IA gagnera t-elle face aux champion du monde du jeu de Go ? :