OpenAI a finalement présenté Sora, un modèle de génération vidéo très attendu, mais les premières impressions des utilisateurs sont décevantes. Malgré des promesses de vidéos de qualité, de nombreux retours critiquent sa performance, soulevant des questions sur sa capacité à rivaliser avec les autres solutions émergentes sur le marché.

OpenAI a teasé et retardé à plusieurs reprises le lancement de Sora pendant près d’un an. Mardi, l’entreprise a finalement dévoilé une version pleinement fonctionnelle de ce nouveau modèle de génération vidéo destiné à un usage public. Malgré l’engouement initial, de plus en plus d’utilisateurs précoces ne semblent pas particulièrement impressionnés. Je ne le suis pas non plus.
Présentation de Sora, notre modèle de génération vidéo à partir de texte.
Sora peut créer des vidéos de 60 secondes avec des scènes très détaillées, des mouvements de caméra complexes et plusieurs personnages aux émotions vives. https://t.co/7j2JN27M3W
Commande : « Beau, enneigé… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) 15 février 2024
L’entreprise a d’abord présenté Sora en février dernier, recevant des éloges pour ses rendus vidéo hyperréalistes. « Sora peut générer des vidéos d’une minute tout en maintenant une qualité visuelle et en respectant la commande de l’utilisateur », écrivait OpenAI dans son blog d’annonce à l’époque. « Le modèle comprend non seulement ce que l’utilisateur a demandé, mais aussi comment ces éléments existent dans le monde physique. »
OpenAI continue de publier des vidéos Sora incroyables.
Celles-ci sont 100 % générées par l’IA.
9 vidéos défiant la réalité
1. Éléphant fait de feuilles pic.twitter.com/tPsHNGbFPS
— Linus Ekenstam (@LinusEkenstam) 18 mars 2024
L’entreprise a diffusé davantage de séquences générées par Sora en mars, cette fois d’un éléphant fait de feuilles, stimulant encore l’engouement autour des capacités du modèle. Le programme Sora a ensuite rencontré une série de retards de développement, que le directeur produit d’OpenAI, Kevin Weil, a attribués lors d’un récent AMA sur Reddit à la « nécessité de perfectionner le modèle, d’assurer la sécurité, l’empreinte et d’autres éléments, et de mettre à l’échelle le calcul ». Parallèlement, The Information a rapporté que les premières versions de Sora souffraient de performances médiocres et avaient du mal à se concentrer sur les commandes des utilisateurs, nécessitant jusqu’à 10 minutes dans le monde réel pour générer un clip d’une minute. Le modèle a également récemment été divulgué en ligne par un groupe de testeurs bêta mécontents qui s’opposaient aux pratiques de « nettoyage artistique » d’OpenAI, mais l’entreprise a rapidement fait retirer l’interface utilisateur non autorisée du groupe de Hugging Face en réponse.
Alors qu’OpenAI peaufinaient et affinaient les performances de Sora, la concurrence s’accaparait son marché. L’IA Firefly d’Adobe, Gen 3 Alpha de Runway, Movie Gen de Meta et Kling de Kuaishou Technology (sans compter d’innombrables options gratuites) ont proliféré sur Internet cette année passée, beaucoup offrant des clips de qualité supérieure et des temps d’inférence plus rapides que ce qu’OpenAI avait promis à plusieurs reprises.
Mardi, OpenAI a officiellement lancé la version prête pour la production de Sora et l’a mise à disposition pour ses abonnés à 20 € par mois pour le Plus et 200 € par mois (lol) pour le Pro. Du moins, l’entreprise l’a fait pendant quelques heures. Comme le commentateur technologique Ed Zitron l’a noté sur Bluesky mercredi, « quelques heures — peut-être même moins — après avoir dit que Sora était disponible, OpenAI a arrêté d’accepter de nouvelles inscriptions sans calendrier clair. OpenAI a trompé toute la presse technologique. Il n’y a aucune chance que cette entreprise puisse se permettre que son générateur vidéo soit accessible au public. »
Cet vidéo est générée par l’IA ! Avis sur SORA
Pour ceux qui ont réussi à accéder, les vidéos que Sora a pu générer étaient peu impressionnantes. Comme l’a souligné la personnalité de YouTube Marques Brownlee lors de sa vidéo pratique avec le modèle, il fallait plusieurs minutes pour générer un clip de 20 secondes en 1080p et il avait d’importantes difficultés à représenter les jambes d’un sujet et leurs mouvements, les jambes avant et arrière échangeant de position de manière anormale tout au long du clip. On peut simplement jeter un coup d’œil à la vidéo générée ci-dessous d’un gymnaste échappant ses bras, ses jambes et sa tête en vol alors qu’il roule sur un tapis pour comprendre ce qu’il voulait dire.
Voici une vidéo de gymnastique générée par Sora
— Peter Labuza (@labuzamovies.bsky.social) 2024-12-11T17:35:23.989Z
L’utilisateur de Bluesky, Peter Labuza, n’a pas hésité à critiquer le modèle, déclarant : « Je suis désolé, mais si vous créez un générateur vidéo à partir de texte et que vous lui dites « fais courir un chat à travers un champ » et vous lui donnez l’image de départ, et que le chat ne fait que RESTER là, votre générateur ne fonctionne PAS. »
L’utilisateur de Bluesky, Chris Offner, partageait un avis similaire, notant sarcastiquement que « Sora est un moteur physique piloté par des données » tout en partageant un clip absolument fou d’un skieur défiant toutes les lois physiques connues.
The Verge a également essayé le modèle, se lamentant du fait qu’il ne pouvait toujours pas éviter des inclusions disgracieuses comme des « membres supplémentaires ou des objets déformés ».
« Sora est un moteur physique piloté par des données. »
— Chris Offner (@chrisoffner3d.bsky.social) 2024-12-10T12:42:53.674Z
Tous n’ont pas immédiatement condamné Sora. L’utilisateur X Nathan Shipley a montré la fonction « remix » du modèle, qui permet aux utilisateurs de masquer une vidéo générée pour correspondre aux mouvements d’objets d’un exemplaire téléchargé. Dans ce cas, il a fait bouger la tête d’une grue générée de la même manière qu’une paire de ciseaux qu’il s’était filmé en tenant.
Test de remix Sora : Ciseaux à grue
La commande était « Gros plan sur une grue curieuse regardant autour d’une belle scène naturelle près d’un étang. La tête de l’oiseau apparaît dans le champ puis disparaît. » pic.twitter.com/CvAkdkmFBQ
— Nathan Shipley (@CitizenPlain) 10 décembre 2024
Aucune annonce n’a été faite concernant la date de réouverture des inscriptions de compte pour les utilisateurs intéressés par Sora. Il reste à voir si OpenAI peut séduire Hollywood avec Sora dans son état actuel, comme l’a récemment fait Runway avec Gen 3 et Lionsgate.
Une chose reste certaine, OpenAI, malgré son avance initiale dans le boom de l’IA, est rapidement dépassé par le reste de l’industrie, et des lancements de produits décevants comme celui que nous venons de voir avec Sora ne feront qu’aggraver la réputation de l’entreprise.
