Google lance son alternative à DALL-E 3: voici tout ce que l’Image 2 peut faire

Google lanza su alternativa a DALL-E 3: esto es todo lo que puede hacer Imagen 2

Image 2 est le nouveau modèle d’IA « texte vers image » de Google, qui permet de générer des images bien plus réalistes.

Google lance sa version alternative à DALL-E 3 : voici tout ce qu'Image 2 peut faire
Quelques exemples d’images générées à l’aide de Image 2, le nouveau modèle de Google

Quelques jours seulement après avoir présenté au monde les capacités de Gemini, son nouveau grand modèle de langage, Google a rendu officielle une nouvelle version d’Image, son modèle texte vers image qui permet de générer des photographies à partir de descriptions de texte. Son nom est Image 2, et la société a promis de grands progrès en termes de précision, de réalisme et de polyvalence du modèle.

Image 2 permet de générer des images plus réalistes avec des textes lisibles

Dans l’annonce, la société affirme que Image 2 est sa technologie de génération d’images la plus avancée à ce jour. Par rapport à la version précédente d’Image, celle-ci est capable de fournir des photographies plus réalistes et de meilleure qualité, en plus d’avoir nettement amélioré la cohérence des résultats à partir des propositions de l’utilisateur.

Image 2 vise DALL-E 3, la dernière version du modèle texte vers image d’Open AI. La société de recherche affirme avoir ajouté des descriptions supplémentaires aux images utilisées dans l’ensemble de données qui a été utilisé pour entraîner le modèle, de sorte que celui-ci puisse comprendre différents styles et être plus précis lorsqu’il suit les indications de l’utilisateur.

Pendant l’entraînement, Google s’est également concentré à améliorer certains des points faibles d’Image (et d’autres modèles de ce type), tels que le rendu d’images, des dents, des visages humains ou d’autres traits avec lesquels l’IA a souvent du mal.

Génération d'images du même style avec Image 2

En combinant du texte et des images en entrée, Image 2 est capable de générer différentes images tout en conservant la cohérence.

!

De même, Image 2 est désormais capable d’insérer du texte lisible dans les images, ainsi que de faire un meilleur travail pour générer des logos ou des icônes de marque. Et ceux qui cherchent à maintenir la cohérence entre différentes images générées avec Image 2, auront la capacité de combiner des propositions de texte et des images d’entrée pour « forcer » le modèle à générer des images dans le même style.

Mais les capacités de Image 2 vont au-delà de la génération d’images. Google explique que la nouvelle version de son modèle peut également être utilisée pour modifier des photographies, par exemple en ajoutant du contenu à des images existantes ou en les agrandissant pour occuper une plus grande zone.

Agrandir des photos avec Image 2

Image 2 permet également d’étendre les images existantes au-delà de leurs limites d’origine

Image 2 est désormais disponible en version générale pour les clients de Vertex AI qui ont accès à la version précédente de l’outil. Pour l’instant, l’outil de génération d’images intégré à SGE est toujours basé sur la première version du modèle Image.