La génération d’images par IA vient de faire un énorme bond en avant

1723873434 La Generation Dimages Par Ia Vient De Faire Un Enorme.jpg

Au cœur des avancées récentes dans le domaine de la création d’images assistée par l’IA, plusieurs entreprises de premier plan ont fait des annonces marquantes. Chaque acteur, de Midjourney à Google en passant par Grok, explore des trajectoires variées, révélant des innovations impressionnantes et des tendances émergentes dans cette technologie en constante évolution.

Nous côtoyons les images générées par l’IA depuis un certain temps, mais cette semaine, certains des grands noms du secteur ont fait des avancées significatives. En particulier, je fais référence aux mises à jour majeures de Midjourney, au nouveau modèle de Google et à Grok.

Chaque entreprise fait évoluer sa technologie à un rythme et dans des directions différentes. Le champ reste encore très ouvert, et chacune montre à quel point les progrès réalisés sont importants.

Midjourney sur le web

Professeur Dumbledore au bord de la piscine dans l'univers de Harry Potter de Wes Anderson.
Image générée par l’IA dans Midjourney.

Commençons par Midjourney, qui a discrètement lancé un nouvel éditeur web tard jeudi, intégrant divers outils d’édition d’images dans une unique interface utilisateur.

Auparavant, des fonctions comme le recadrage, le retraitement (ajout ou modification d’éléments générés par l’IA à une image existante), le panoramique, l’extension de toile (élargir les limites de l’image et générer du contenu pour remplir) et le zoom nécessitaient chacun leur propre outil, dispersé dans plusieurs menus, obligeant les créateurs à faire des allers-retours constants. Cette nouvelle interface offre un processus d’édition plus cohérent et fluide, marquant une rupture avec les débuts du programme sur Discord.

Midjourney vient de sortir son éditeur web !!

C’est en réalité l’une des fonctionnalités les plus intéressantes qu’ils ont lancées depuis un certain temps

permet de faire du inpainting, panning, zoom et plus, tout en une seule étape

vraiment puissant pic.twitter.com/Wgyi9ElE5N

— Nick St. Pierre (@nickfloats) 16 août 2024

Le nouvel éditeur vise à simplifier l’édition des images générées par l’IA, comme l’a mentionné récemment David Holz, PDG de Midjourney, sur Discord. “Nous estimons que cela rend l’édition de vos images MJ beaucoup plus fluide qu’auparavant et représente un grand pas en avant,” a-t-il écrit.

Bien que Midjourney s’éloigne progressivement de Discord pour devenir une application web, la société a également annoncé qu’elle synchronisera les messages des canaux populaires comme “daily-theme,” “prompt-craft,” et “general-1” entre ses salles web et les canaux Discord, permettant aux utilisateurs de suivre ces discussions depuis la plateforme de leur choix. Elle a également introduit un nouvel outil de sélection qui fonctionne comme un pinceau numérique, remplaçant les outils de sélection carrée et de lasso.

Ce nouvel éditeur est accessible à tous les utilisateurs de Midjourney ayant déjà généré plus de 10 images sur la plateforme. Les réactions initiales de la communauté des créateurs sont majoritairement positives.

L’éditeur arrive deux semaines après la sortie de Midjourney 6.1, qui a amélioré la qualité d’image et la cohérence (comme le bon nombre de doigts), tout en réduisant significativement les temps de traitement et en améliorant la précision de compréhension du texte dans ses invites.

Grok-2 libère le monstre

La mise à jour de Midjourney a également suivi de près le lancement de Grok-2 par la startup xAI d’Elon Musk, qui est l’autre grande actualité de la semaine.

Les capacités de génération d’image de Grok sont propulsées par le modèle Flux.1 de Black Forrest Lab, qui gagne rapidement en popularité grâce à la qualité d’image impressionnante et à son utilisation gratuite.

24 heures après le lancement de Grok 2.0 et ses capacités de création d’images !

J’ai préparé 9 exemples pour vous en tirer le meilleur parti + accès à une bibliothèque de prompts sans fin !

(Ajoutez ceci à vos favoris pour plus tard) pic.twitter.com/7EDYSogfV2

— TechHalla (@techhalla) 15 août 2024

La plus grande controverse autour de Grok-2 ne concerne pas seulement sa qualité, qui est plutôt bonne, mais aussi ses lignes directrices apparemment vagues. Contrairement à bon nombre d’autres générateurs d’images IA, Grok-2 semble avoir peu de règles concernant la propriété intellectuelle, la violence et d’autres contenus explicites. Ce n’est pas la première fois qu’un générateur d’images IA fait face à ce genre de problème, mais avec Grok, cela semble délibéré, Musk le qualifiant de “l’IA la plus amusante au monde”.

Les utilisateurs ont déjà testé ses limites, produisant toutes sortes d’images dérangeantes et étranges, rappelant les débuts de la génération d’images IA. Mais si l’on croit à la rhétorique de Musk, le manque de lignes directrices de Grok-2 semble intentionnel et pourrait façonner l’évolution future de cette technologie.

Google entre dans la compétition avec Imagen 3

La generation dimages par IA vient de faire un enorme.webp
Une image générée par le modèle Imagen-3 de Google.

Enfin, Google a annoncé son nouveau modèle d’IA Imagen 3, qui a été lancé pour tous les utilisateurs américains jeudi. Google le décrit comme son “modèle texte-image de la plus haute qualité,” capable de produire “de meilleurs détails, un éclairage plus riche et moins d’artefacts distracteurs que ses modèles précédents.” La firme indique également qu’Imagen-3 est plus efficace dans le rendu du texte et est désormais disponible dans différentes versions, dédiées à des tâches spécifiques, comme des esquisses rapides ou des images plus détaillées et haute résolution.

Pour l’instant, Imagen 3 n’est accessible que via l’AI Test Kitchen de Google, dans le cadre d’ImageFX. Actuellement en bêta fermée, il vous faudra rejoindre la liste d’attente si vous n’êtes pas encore participant.