DragGAN est un nouveau modèle d’IA qui facilite la manipulation des images. Les résultats sont tout simplement incroyables.
Les modèles d’intelligence artificielle générative ouvrent la porte à la simplification de processus qui, jusqu’à il y a peu, ne pouvaient être réalisés que par des professionnels qualifiés disposant d’outils suffisants. Nous avons déjà vu des modèles capables de générer des pages Web fonctionnelles, d’effectuer des tâches de programmation ou de générer des images avec peu d’effort.
Le dernier exemple qui démontre le niveau atteint par le domaine du développement de l’intelligence artificielle porte le nom de DragGAN, et bien qu’il ne s’agisse pour l’instant que d’un travail de recherche, il a réussi à surprendre les utilisateurs avec sa capacité à modifier des images simplement en faisant glisser les éléments qui y figurent.
DragGAN vous permet de manipuler des images simplement en les faisant glisser
D’une manière générale, DragGAN est un modèle qui vous permet de modifier les dimensions des éléments qui apparaissent à l’intérieur d’une image. Mais les capacités de ce modèle vont bien au-delà de ce que nous pourrions faire avec des outils de manipulation d’images. Selon les chercheurs, il a été possible d’accorder un contrôle précis et flexible de la position, de la forme, de l’expression et de la disposition des éléments d’image grâce à des gestes de glissement.
Dans la vidéo de démonstration, vous pouvez voir les capacités de l’outil plus en détail.
Faites glisser votre GAN : Manipulation interactive basée sur des points sur le collecteur d’images génératives
page papier : https://t.co/Gjcm1smqfl pic.twitter.com/XHQIiMdYOA
—AK (@_akhaliq) 19 mai 2023
En modifiant les dimensions ou la forme des éléments, le modèle adapte l’image pour qu’elle reste réaliste et que toutes les parties de l’image conservent leurs proportions. Ainsi, en combinant l’outil avec des services d’imagerie AI, il est possible d’obtenir les résultats souhaités en modifiant ultérieurement les images à l’aide de DragGAN.
Cependant, les résultats ne sont pas parfaits à 100 %. Les responsables du projet expliquent que le modèle peut halluciner des contenus occlus, comme les dents dans la gueule d’un lion, et se déformer suivant la rigidité de l’objet, comme la flexion d’une jambe de cheval.
Pour l’instant, il s’agit d’une démonstration technique et il n’y a pas d’outil ouvert au public pour tester le modèle.
Détente, découvrez l’évolution du nombre de smartphones vendus par marque au fil du temps dans la vidéo ci-dessous :