Une révolution se profile dans la création audiovisuelle, marquée par l’arrivée de Veo 2 de Google. Capable de générer des vidéos en 4K avec une qualité exceptionnelle, cette technologie propose des mouvements naturels et une compréhension fine des expressions humaines. Une avancée qui pourrait redéfinir les standards du secteur.
Impose une mise à jour très intéressante de sa première version

Ces derniers mois, des outils innovants ont vu le jour, transformant la création et le traitement des contenus audiovisuels. Parmi eux, Sora d’OpenAI a récemment été lancé, bien que ses résultats aient suscité des réserves. Ces technologies reposent sur des descriptions textuelles, permettant d’explorer des niveaux de détail inédits, une représentation plus précise des scènes et une souplesse croissante pour s’adapter à divers styles, qu’ils soient statiques ou dynamiques, qu’il s’agisse de photos ou de vidéos. Il y a à peine un an, les images générées laissaient à désirer, avec des mains déformées et des visages peu convaincants. Cette époque est révolue.
Google Veo 2
Il y a seulement quelques jours, Google a annoncé sur son blog le lancement de Veo 2, une nouvelle version de son système dédié à la génération vidéo qui démontre une capacité à surpasser les modèles existants, offrant une qualité visuelle élevée dans une grande variété de scènes. Cet outil non seulement recrée les mouvements humains de manière plus naturelle, mais comprend également les expressions faciales, le langage corporel, ainsi que des éléments cinématographiques tels que les angles de caméra, les effets optiques et la gestion de la profondeur de champ. Avec Veo 2, il est possible de demander à l’IA une scène avec des propriétés très spécifiques : objectifs adaptés, plans variés et utilisation de l’éclairage pour mettre en valeur différents aspects.
Par ailleurs, elle propose des contenus de qualité supérieure à ceux de ses concurrents, en 4K, avec la capacité de produire des séquences plus longues, allant au-delà de simples extraits, avec plusieurs minutes de contenu continu. Cette caractéristique représente un défi supplémentaire, car maintenir la cohérence sur une période prolongée n’est pas une mince affaire. Les tests menés incluent des séquences avec des scientifiques travaillant dans des laboratoires bien équipés, des paysages naturels riches en végétation, des scènes urbaines et des animations d’une grande fidélité, où des éléments abstraits prennent des textures réalistes. Veo 2 évite les erreurs typiques de ces modèles d’IA, comme l’apparition d’objets non sollicités ou des incohérences dans le mouvement, nous faisant penser que ce que nous voyons n’est pas réel.
L’intégration d’un système de filigranes invisibles, appelé SynthID, constitue une contribution significative, car il permet d’identifier le contenu généré par intelligence artificielle sans altérer l’apparence de la vidéo, un pas essentiel pour freiner la diffusion de désinformation. Ces dernières années, des rumeurs ont émergé grâce à ces technologies, et il sera désormais encore plus facile avec Veo 2.
Par ailleurs, Google a également annoncé Imagen 3, dédiée à la création d’images qui respectent davantage les instructions fournies dans nos demandes.
D’après les évaluations indépendantes utilisées par Google, Imagen 3 dépasse d’autres modèles dans de nombreux cas, se distinguant par sa capacité à reproduire détails et textures, ce qui la rend utile pour la création d’illustrations, de matériel publicitaire, de croquis conceptuels et de contenus créatifs nécessitant une précision dans l’apparence finale.
Veo 2 est déjà disponible dans VideoFX au sein de Google Labs et étendra son utilisation à YouTube Shorts et d’autres produits aux États-Unis, bien qu’en Europe, son déploiement simultané soit difficile en raison de la réglementation sur l’IA sur le Vieux Continent.
