La version 5 de Midjourney améliore presque tous les aspects des images générées par l’IA

Midjourney version 5 improves almost every aspect of AI-generated images

S’améliorer : avec toutes les nouvelles récentes concernant ChatGPT et d’autres grands modèles de langage, il est facile d’oublier que leurs cousins, les générateurs d’images IA, continuent de s’améliorer. On a peut-être trouvé comment rendre les yeux et les mains sans que le sujet ressemble à quelque chose d’un cauchemar. cependant, les résultats effraient encore certaines personnes.

Plus tôt cette semaine, le laboratoire de recherche Midjourney a publié une version bêta de la version 5 de son logiciel d’imagerie AI. Selon son annonce via Twitter, la dernière version ajoute une meilleure qualité d’image, des résultats plus « diversifiés », une gamme de styles plus étendue, des textures homogènes et bien plus encore.

Les utilisateurs ont déjà publié des centaines de résultats époustouflants et les sentiments concernant les améliorations sont mitigés. La plupart sont impressionnés car l’IA d’imagerie a eu du mal à produire des aspects tels que les ombres, les reflets, les yeux et les mains. Vous trouverez ci-dessous une image que nous avons créée avec Dall-E d’OpenAI comme exemple d’endroit où la machine a des problèmes.

La version 5 de Midjourney ameliore presque tous les aspects

La composition est quelque peu décalée et l’ambiance générale est caricaturale. L’éclairage est tout faux. Les yeux et les mains sont très déformés. Les jambes sont encrassées d’artefacts, tout comme le récipient de pop-corn et le siège à côté du sujet. Ce résultat est l’un des quatre avec des problèmes similaires à des degrés divers.

1679089688 461 La version 5 de Midjourney ameliore presque tous les aspects

La version 5 de Midjourney semble s’être améliorée à cet égard, du moins d’après les exemples que d’autres ont partagés. Les résultats de simples invites frôlent l’étrange vallée – suffisamment réalistes pour passer pour des photos professionnelles dans de nombreux cas, mais toujours avec cette qualité étrange que vous ne pouvez pas tout à fait situer. Bien qu’incroyablement réalistes, beaucoup ont décrit les images comme effrayantes.

Notre propre Kishalaya Kundu a déclaré : « Je suis plus effrayé qu’impressionné, pour être honnête », après avoir visionné une série de photos presque parfaites de Midjourney V5. La crainte étant que l’on puisse assez facilement créer une fausse image et la faire passer pour authentique.

1679089688 456 La version 5 de Midjourney ameliore presque tous les aspects

Mis à part le facteur de fluage, par rapport à V4, Midjourney V5 a considérablement amélioré la qualité. La graphiste Julie Wieland utilise Midjourney V4 (sortie en novembre dernier) depuis un certain temps et affirme que la version 5 a des textures de peau « incroyablement réalistes ». Les effets d’éclairage sont également bien meilleurs, y compris les reflets, les reflets et les ombres. Peut-être plus important encore, l’IA génère des mains et des yeux qui semblent naturels la plupart du temps.

« Les yeux sont presque parfaits et ne sont plus bancaux », a déclaré Wieland à Ars Technica. « Les mains sont correctes la plupart du temps, avec cinq doigts au lieu de 7-10 sur une main. MJ v5 me donne actuellement l’impression d’avoir enfin des lunettes après avoir ignoré la mauvaise vue pendant un peu trop longtemps. Soudain, vous voyez tout en 4k ; c’est se sent étrangement écrasant mais aussi incroyable. »

Midjourney a également amélioré la résolution native de 512x512px à 1024x1024px. L’augmentation l’aligne sur Dall-E. Cependant, la version 4 pourrait suréchantillonner pour doubler la résolution native. Il n’est pas déraisonnable de s’attendre à ce que la V5 utilise la même technique pour produire des images 2048×2048, mais c’est pour une mise à jour plus tard.

1679089688 660 La version 5 de Midjourney ameliore presque tous les aspects

En fin de compte, MidJourney n’est arrivé sur la scène de l’IA qu’il y a un an. Beaucoup (pas toutes) de ces images inondant les flux Twitter cette semaine sont intactes. Auparavant, Weiland utilisait une combinaison de techniques pour améliorer la qualité visuelle de Midjourney 4, y compris la « surimpression » avec Dall-E et les retouches dans Photoshop. La version 5 promet moins d’édition post-génération et peut-être des images parfaites pour la photo plus tôt que nous ne pouvons l’imaginer. Cette perspective est en effet à la fois excitante et effrayante.


Découvrez le reportage du mois (sous-titré en français), l’IA gagnera t-elle face aux champion du monde du jeu de Go ? :