L’univers des générateurs d’images par intelligence artificielle connaît une effervescence inédite, avec des acteurs comme Midjourney et Grok qui se distinguent par leurs fonctionnalités uniques. Dans un contexte où la créativité numérique et les enjeux éthiques se rencontrent, il est essentiel de connaître les caractéristiques et les différences entre ces deux plateformes.

Dans le domaine des générateurs d’images IA, les options ne manquent pas. Deux d’entre eux se détachent particulièrement (parmi Dall-E, Firefly, Stable Diffusion et Playground AI) : Midjourney, reconnu pour ses images remarquablement réalistes, et Grok 2, capable de transformer presque n’importe quelle idée en image, transcendant les barrières de droits d’auteur et les normes sociétales.
Voici les points essentiels à connaître pour chacun.
Tarification et niveaux

Il vous faudra débourser un certain montant pour essayer ces plateformes, car aucune ne propose de niveau gratuit. X (anciennement Twitter) offre un compte premium à 7 $ par mois, ce qui réduit de moitié les publicités et améliore la portée des réponses par rapport à la version standard, tandis que le forfait Premium+ à 14 $ par mois élimine totalement les publicités et permet de rédiger des articles et des tweets. Ces deux abonnements vous donneront accès en avant-première à Grok.
Midjourney, quant à lui, présente quatre niveaux d’abonnement, facturés mensuellement ou annuellement. Le plan de base coûte 10 $ par mois et vous donne droit à 3,3 heures d’utilisation rapide du GPU par mois. Vous pouvez acheter plus de temps d’accès pour 4 $ chacun. Le plan Standard à 30 $ par mois augmente ce temps à 15 heures avec un accès illimité au GPU « Relax ».
Le plan Pro à 60 $ par mois vous permet d’accéder à 30 heures de GPU rapide et, pour 120 $ par mois, le plan Mega vous offre 60 heures. À noter que si votre entreprise génère plus d’un million de dollars de revenus par an, vous devez souscrire au plan Pro ou Mega.
Qu’est-ce que Grok, et que peut-il faire ?
Grok est un chatbot développé par xAI, la startup fondée par Elon Musk après son départ du conseil d’administration d’OpenAI à cause d’un problème de gouvernance. Le modèle Grok-1 a été lancé en novembre 2023 et, selon Musk, a été entraîné sur un ensemble de « dizaines de milliers » de GPU. Grok-1.5 a remplacé Grok-1 en mars 2024, avant que Grok-2 ne fasse son apparition en août 2024.
Grok fonctionne principalement comme un chatbot, à l’instar de ChatGPT, Gemini, Claude ou Copilot. Il est formé à partir d’un mélange de données internet publiques (jusqu’à la seconde moitié de 2023) et de données utilisateurs de X — engloutissant des milliards de tweets et de notes communautaires. Grok est unique car il est directement lié à la plateforme sociale X, lui permettant d’accéder à des informations en temps réel, contrairement à d’autres chatbots qui ne peuvent effectuer des recherches qu’après leurs dates de coupure.
Cela permet à Grok de rester au courant des événements mondiaux, mais cela pourrait également augmenter le risque d’hallucinations factuelles et de réponses inappropriées en raison des sources utilisées.
Grok 2 se fiche éperdument des droits d’auteur lmao
Ça va être amusant tant que ça dure pic.twitter.com/qiiScOGt8I
— Brendon (@Bmaynze) 14 août 2024
La version la plus récente de Grok est la première à offrir des capacités de génération d’images, grâce à son intégration avec le modèle Flux.1 développé par Black Forrest Labs. Grok-2 a fait du bruit à son lancement en août, car, contrairement aux autres chatbots, ses capacités de création d’images ne comportent pas de garde-fous visibles pour empêcher la génération d’images protégées par droits d’auteur, violentes, racistes ou potentiellement nuisibles.
Qu’est-ce que Midjourney, et que peut-il faire ?
Midjourney est l’un des pionniers des générateurs d’images dans la révolution IA, aux côtés de Dall-E et Stable Diffusion. Bien qu’il ne dispose pas d’un composant chatbot comme Grok, Midjourney produit des images sur la base de vos commandes en langage naturel via un bot Discord ou l’éditeur web de l’entreprise.
Il peut créer des images dans divers styles, allant de l’animation cartoon au style illustration à la main, jusqu’à des photos glamour photoréalistes, comme en témoigne le mème « Pape en veste en plumes » de 2023. Lancé d’abord en version bêta ouverte en 2022, l’IA a connu de multiples itérations, la dernière en date, version 6.1, étant disposée fin juillet 2024.

Midjourney s’est déjà fait un nom en tant que générateur d’images de premier plan, ses œuvres apparaissant sur les couvertures de publications nationales telles que The Economist et The Atlantic. Il a même remporté la première place au concours d’art numérique de la foire d’État du Colorado en 2022 avec son œuvre Théâtre D’opéra Spatial, illustrée ci-dessous.

Contrairement à Grok, Midjourney (à partir de la version 5) utilise un système de modération de contenu basé sur l’IA, plus nuancé que le système de mots interdits précédemment en vigueur.
L’ancien système interdisait simplement la génération de thèmes pornographiques et violents, ainsi que certains mots-clés comme les noms de figures religieuses et politiques. Le nouveau système de modération propose une plus grande flexibilité dépendant du contexte. Ainsi, il est désormais possible de générer une image du président chinois Xi Jinping (impossible avec les anciennes règles), mais il est toujours interdit de l’imaginer menotté (sauf avec Grok).
Lequel est le mieux pour vous ?
Sans aucun doute, Midjourney. À moins que vous ne cherchiez à enfreindre la loi sur les droits d’auteur ou à diffuser de fausses informations avant les élections présidentielles de novembre, il n’y a pas d’intérêt à soutenir le site de médias sociaux d’Elon Musk avec vos 7 $ par mois.
