Diffusion stable : comment créer des images avec l’IA

Diffusion Stable : Comment Créer Des Images Avec L'ia

Les soi-disant générateurs de texte en image tels que Dall-E 2 ou Imagen de Google sont actuellement à la mode. Ils prennent des textes, des mots-clés ou des phrases entières en entrée et les utilisent pour générer une image à l’aide de l’intelligence artificielle. Un autre générateur appelé Stable Diffusion fait le tour en ce moment car il a montré qu’il pouvait donner de bons résultats et il est gratuit dans la version de base. Nous l’avons essayé et vous montrons ce dont vous avez besoin pour le faire aussi :

Voici comment vous pouvez essayer Stable Diffusion par vous-même

La méthode la plus simple consiste probablement à utiliser le générateur dans le navigateur via DreamStudio. Pour ce faire, rendez-vous simplement sur https://beta.dreamstudio.ai/ et créez un compte ou connectez-vous. Un petit tutoriel explique ensuite le fonctionnement de l’interface.

Je vous conseille de lire le guide d’invite au préalable afin de ne gaspiller aucune de vos images gratuites. Ils sont limités à environ 150 images standard. Mais cela suffit pour l’essayer. Si cela ne vous suffit pas, vous pouvez utiliser un compte payant ou exécuter Stable Diffusion sur votre propre matériel.

Pour ce faire, le moyen le plus simple consiste à utiliser l’interface graphique de diffusion stable NMKD, développée par un utilisateur de Reddit. Vous pouvez les télécharger à partir de ce site Web. Ensuite, vous extrayez les fichiers dans un dossier. Cependant, aucun dossier protégé et non dans vos fichiers de programme.

Exécutez ensuite le fichier StableDiffusionGui.exe sous Windows et suivez les instructions du programme. Gardez à l’esprit que le programme ne fonctionne actuellement qu’avec une carte graphique Nvidia avec au moins 10 gigaoctets de mémoire. Il ne fonctionne pas sur les cartes AMD dans cette version.

Est-ce vraiment si facile de créer de l’art ?

Ce qui est possible avec Stable Diffusion est montré, par exemple, par cet utilisateur de Twitter, qui a généré un voyage dans le temps à travers l’histoire humaine avec des chats :

Vous pouvez trouver de nombreux autres exemples dans la bibliothèque Lexica. Le montre les images créées avec Stable Diffusion et indique les « promts » qui ont été utilisés. Ainsi, les entrées de texte pour créer l’image.

Beaucoup d’images sont vraiment impressionnantes, certaines même réalistes. Bien sûr, nous nous demandons s’il est vraiment aussi simple de créer de belles images avec le générateur de texte en image. En tant qu’éditeur, cela nous éviterait, par exemple, la recherche d’images pour nos articles, puisque nous pourrions simplement les générer en saisissant du texte.

Pour notre test, nous avons utilisé Stable Diffusion via DreamStudio. Vous pouvez également exécuter l’IA sur votre propre ordinateur, mais vous avez actuellement besoin d’une carte graphique Nvidia avec au moins 10 gigaoctets de mémoire. Comme je n’ai actuellement que mon Ultrabook avec un Intel Iris Xe intégré, j’ai testé la version navigateur.

Fondamentalement, vous utilisez le générateur ici comme vous le feriez sur votre propre PC. La différence est que l’offre n’est pas entièrement gratuite. Après vous être connecté à DreamStudio pour la première fois, vous obtenez un contingent d’environ 150 images que vous pouvez générer. Vous devez payer pour plus de photos. Si l’IA fonctionne sur votre propre matériel, vous pouvez l’utiliser gratuitement.

Avec la version DreamStudio, vous pouvez définir la hauteur et la largeur de l’image – et la proximité conceptuelle de l’entrée. Vous pouvez donc donner à l’IA une certaine « liberté artistique ». Vous définissez également le nombre d’étapes dans lesquelles l’image est générée. Ici, plus d’étapes conduisent généralement à un meilleur résultat.

Pour ce faire, vous définissez combien d’images doivent être générées en même temps et quel échantillonneur doit être utilisé. Il y a aussi un « Promt Guide » pour les débutants comme moi. Cela donne des conseils et des instructions sur les invites avec lesquelles le générateur peut fonctionner le mieux.

C’est ce qui est sorti pour nous

Pour le test, j’ai eu un total d’environ 100 images générées et bien sûr, je ne veux pas vous cacher les résultats. Les premières images que j’ai générées étaient tout simplement inutilisables. Mais c’était principalement parce que j’ai entré intuitivement des invites comme « l’homme avec un ballon » ou « la femme dans le parc ».

Après avoir lu le guide des invites et essayé certaines des invites de Lexica, les résultats étaient meilleurs. Certaines photos étaient même très bonnes, comme cette petite sélection :

J’ai l’impression que Stable Diffusion fonctionne mieux lorsque le logiciel n’a pas besoin d’afficher des visages, humains ou animaux. Il y a souvent des incohérences ici. D’autres images semblent bonnes à première vue mais ont des défauts évidents, comme le panda à trois oreilles ou le cerf à long cou avec des bois légèrement étranges :

Le magasin d’électronique a également l’air bien à première vue, mais les détails manquent. Il n’y a eu aucun échec absolu dans mon test. Avec des entrées raisonnablement raisonnables, des images sont toujours sorties qui étaient au moins présentables.

Cependant, l’IA a des problèmes avec les proportions, en particulier avec les visages humains, et les visages sont souvent simplement barbouillés, comme sur ces images :

Il est également arrivé une ou deux fois que l’image soit complètement floue, mais pas nette. Bien sûr, cela est particulièrement gênant lorsque vous payez pour le service.

Conclusion

Au moins après un premier test de Stable Diffusion avec environ 100 images, je peux dire que l’IA n’est pas encore prête à générer des images réalistes sur simple pression d’un bouton. La qualité des images varie également beaucoup. Parfois, je me demandais à quel point l’image était belle, d’autres fois, je me demandais quel genre de monstre j’avais créé.

En général, je trouve incroyable ce que l’IA peut faire. D’autant plus que l’apport de ma part et des autres utilisateurs de l’IA est souvent minime. L’IA doit non seulement comprendre les mots que j’y tape, mais aussi les mettre en contexte.

1662187691 854 Diffusion stable comment creer des images avec lIA
Ce chevalier créé par l’IA a une étrange épée sur son épaule. De telles erreurs se produisent parfois.

Si je veux une image avec un « chevalier avec une épée » de l’IA, elle doit savoir ce qu’est un chevalier, ce qu’est une épée et aussi ce qu’un chevalier fait habituellement avec une épée. Par exemple, le tient-il à la main ou le porte-t-il dans son fourreau ? L’IA semble être bonne pour gérer de telles informations.

Puisque Stable Diffusion est gratuit, vous devriez certainement essayer le générateur si le sujet vous intéresse !

Diffusion stable comment creer des images avec lIA