L’intelligence artificielle progresse rapidement, permettant à de nombreux assistants AI de générer des images, d’agir comme des chatbots ou de réaliser des recherches approfondies. De plus, certains d’entre eux permettent maintenant de créer des vidéos, que ce soit directement ou via un logiciel associé.
Avec tant d’options pour la génération de vidéos par IA, j’ai décidé de tester quelques-unes des plus populaires en leur fournissant le même prompt afin de déterminer laquelle produit la meilleure vidéo. Cela incluait Sora, qui alimente la génération vidéo sur Microsoft Copilot, développé par OpenAI. J’ai également testé Grok et Google Gemini.
Pour le prompt, j’ai veillé à donner aux logiciels d’intelligence artificielle exactement la même instruction. Je souhaitais inclure des humains dans la vidéo pour évaluer le réalisme des résultats. Je voulais un avant-plan et un arrière-plan pour offrir une certaine profondeur.
J’ai demandé que le sujet de la vidéo fasse un signe de la main pour voir à quel point les générateurs vidéo d’IA peuvent réaliser des mains et des doigts. Les IA peuvent parfois rencontrer un problème appelé hallucination, où les vidéos contiennent des éléments non souhaités.
Voici le prompt exact que j’ai fourni aux assistants d’intelligence artificielle :
Créez une vidéo d’un homme utilisant un ordinateur portable, dans un environnement de bureau avec des personnes derrière lui. Il lève ensuite les yeux vers la caméra et fait un signe de la main avec un sourire. L’atmosphère est tendue au départ puis devient plus détendue lorsqu’il sourit à la caméra.
Voici les résultats obtenus avec le prompt ci-dessus, classés par ordre de performance :
3. Sora (ChatGPT et Microsoft Copilot)
Sora est l’outil de génération vidéo d’OpenAI. Bien que ChatGPT ne puisse pas créer de vidéos, il vous dirige vers Sora pour que cela soit fait. Microsoft Copilot permet également de générer des vidéos au sein de son interface, mais cela est aussi alimenté par Sora. Pour utiliser Sora, que ce soit directement sur la plateforme ou via Microsoft Copilot, vous devez disposer d’un abonnement premium pour un coût de 19,99€ par mois.
J’ai généré cette vidéo directement dans Sora et j’ai été quelque peu déçu par les résultats. La qualité de la vidéo est excellente et le sujet est net, avec un arrière-plan flou mais reconnaissable.
Cependant, bien que l’ambiance soit correcte, le sujet ne fait pas vraiment ce que j’ai demandé, ce qui signifie qu’il n’a pas respecté le prompt. De plus, au début de la vidéo, il semble ne pas regarder l’écran de son ordinateur portable, mais plutôt au-delà.
Malgré la haute qualité de cette vidéo, il est difficile de la classer en tête car le prompt n’a pas été respecté.
2. Grok
Avant d’évaluer la vidéo de Grok, il est important de souligner que Grok est le seul outil de génération vidéo par IA disponible gratuitement. Bien qu’un compte soit nécessaire pour générer des vidéos, un abonnement payant n’est pas requis.
La vidéo a très bien suivi le prompt, avec un arrière-plan et une ambiance clairement définis dans un environnement de bureau. Le sujet regarde la caméra et fait un signe de la main, bien qu’on puisse apercevoir un léger défaut au niveau des doigts. Il est évident que la vidéo est générée par IA en raison d’un filtre de lissage étrange appliqué.
Bien que cette vidéo ne soit pas la meilleure de celles que j’ai générées, c’était la seule que j’ai pu créer gratuitement. Par rapport à Sora, elle a été plus satisfaisante car elle a respecté le prompt.
1. Veo 3 (Google Gemini)
Pour générer une vidéo avec Google Gemini, il faut accéder à Veo 3. Un abonnement payant est requis pour utiliser Veo 3, avec un essai gratuit d’un mois disponible, mais les utilisateurs payants doivent s’acquitter de 19,99€.
La vidéo générée par Veo 3 s’est démarquée nettement. La qualité était extrêmement élevée, avec un arrière-plan flou et le sujet parfaitement net. L’ambiance correspondait au prompt, montrant le sujet à la fois tendu lorsqu’il utilisait son ordinateur, puis souriant à la caméra.
Lorsque le sujet fait un signe de la main, les mains et les doigts apparaissent très réalistes sans aucune erreur ou hallucination. Cette séquence pourrait figurer dans une vidéo promotionnelle ou une publicité à la télévision, tant elle était réaliste et respectait le prompt.
Veo 3 mérite la première place avec une vidéo claire, sans problème. Néanmoins, Grok a également produit une bonne vidéo et reste une excellente option gratuite pour ceux qui ne souhaitent pas payer pour un outil AI.
