OpenAI a présenté la dernière version de son modèle d’IA pour générer des images

Image générée par DALL-E 3.

OpenAI est actuellement la société d’IA la plus puissante sur terre. Les partenariats avec Microsoft ont permis à l’entreprise de consolider sa position et de faire croître ChatGPT, son modèle d’IA conversationnelle désormais utilisable pratiquement partout.

Une grande partie du public semble oublier qu’OpenAI est également responsable de DALL-E, l’une des principales alternatives à Midjourney et l’un des générateurs d’images IA les plus remarqués il y a quelque temps. Maintenant, OpenAI a annoncé DALL-E 3, la dernière itération du modèle, qui apporte également plusieurs nouveautés intéressantes.

Intégration avec ChatGPT et génération d’images plus puissante

La troisième version de DALL-E a été présentée lors d’une démonstration par The Verge. Lors de cette démonstration, on a pu observer une amélioration notable de ses capacités et la possibilité de générer des résultats dans l’application ChatGPT. En général, il semble que l’IA soit plus précise lorsqu’il s’agit de lire les instructions de l’utilisateur et de créer à partir de là.

La démonstration a montré que si l’utilisateur n’était pas capable de fournir une série d’instructions maximisant les capacités du générateur d’images, alors ChatGPT l’aidait à écrire des instructions plus précises. Et bien que les images n’aient pas pu être affichées pour des raisons juridiques, ces résultats semblent être « impressionnants » selon le média.

D’après les informations auxquelles nous avons eu accès, DALL-E 3 améliore également des éléments problématiques que ses prédécesseurs et d’autres modèles de génération d’images doivent encore combattre. Parmi eux se trouve une meilleure inclusion de texte dans les images, ainsi que la représentation de parties du corps humain.

OpenAI a également inclus des mesures visant à éviter les problèmes légaux à l’avenir. Sa nouvelle version de DALL-E peut générer des images pratiquement comme le feraient des artistes humains, mais à l’avenir, l’IA sera programmée pour refuser cette demande.

