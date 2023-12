Image 2 est le nouveau modèle d’IA « texte vers image » de Google, qui permet de générer des images bien plus réalistes.

Quelques exemples d’images générées à l’aide de Image 2, le nouveau modèle de Google

Quelques jours seulement après avoir présenté au monde les capacités de Gemini, son nouveau grand modèle de langage, Google a rendu officielle une nouvelle version d’Image, son modèle texte vers image qui permet de générer des photographies à partir de descriptions de texte. Son nom est Image 2, et la société a promis de grands progrès en termes de précision, de réalisme et de polyvalence du modèle.

Image 2 permet de générer des images plus réalistes avec des textes lisibles

Dans l’annonce, la société affirme que Image 2 est sa technologie de génération d’images la plus avancée à ce jour. Par rapport à la version précédente d’Image, celle-ci est capable de fournir des photographies plus réalistes et de meilleure qualité, en plus d’avoir nettement amélioré la cohérence des résultats à partir des propositions de l’utilisateur.

Image 2 vise DALL-E 3, la dernière version du modèle texte vers image d’Open AI. La société de recherche affirme avoir ajouté des descriptions supplémentaires aux images utilisées dans l’ensemble de données qui a été utilisé pour entraîner le modèle, de sorte que celui-ci puisse comprendre différents styles et être plus précis lorsqu’il suit les indications de l’utilisateur.

Pendant l’entraînement, Google s’est également concentré à améliorer certains des points faibles d’Image (et d’autres modèles de ce type), tels que le rendu d’images, des dents, des visages humains ou d’autres traits avec lesquels l’IA a souvent du mal.

De même, Image 2 est désormais capable d’insérer du texte lisible dans les images, ainsi que de faire un meilleur travail pour générer des logos ou des icônes de marque. Et ceux qui cherchent à maintenir la cohérence entre différentes images générées avec Image 2, auront la capacité de combiner des propositions de texte et des images d’entrée pour « forcer » le modèle à générer des images dans le même style.

Mais les capacités de Image 2 vont au-delà de la génération d’images. Google explique que la nouvelle version de son modèle peut également être utilisée pour modifier des photographies, par exemple en ajoutant du contenu à des images existantes ou en les agrandissant pour occuper une plus grande zone.

Image 2 est désormais disponible en version générale pour les clients de Vertex AI qui ont accès à la version précédente de l’outil. Pour l’instant, l’outil de génération d’images intégré à SGE est toujours basé sur la première version du modèle Image.