Les avancées de l’IA modifient la création de contenu, facilitant le processus pour tous, même les novices. Meta a récemment présenté Movie Gen, un nouvel outil de génération audio et vidéo à partir de texte. Cet outil promet de rendre la création de vidéos plus accessible avec des possibilités de personnalisation étendues.
Les progrès réalisés dans le domaine de l’IA visent à surmonter de nombreux défis financiers et techniques qui compliquent la création de contenu en dehors des grands centres de données cloud. Les équipes de recherche en IA développent des outils permettant même aux créateurs les plus novices de générer du contenu à partir de simples descriptions de ce qu’ils souhaitent voir. Cette semaine, Meta a publié un article de blog mettant en avant Movie Gen, le prochain générateur audio et vidéo texte-à-contenu de l’entreprise.
Movie Gen a été introduit cette semaine par Mark Zuckerberg dans un post sur Instagram, nous rappelant de ne pas négliger notre entraînement. L’aperçu est dévoilé plusieurs mois après la présentation de la solution Sora IA d’OpenAI pour le texte-à-vidéo.
Un communiqué plus long et informatif a été publié sur le blog de l’équipe de recherche en IA de Meta, fournissant des informations supplémentaires sur les capacités de Movie Gen. Le nouvel outil supportera la génération et l’édition de vidéos et d’audios basés sur du texte.
Le post comprend plusieurs vidéos montrant la capacité de Movie Gen à créer et modifier facilement du contenu basé sur des entrées textuelles de l’utilisateur, produisant des vidéos d’une durée allant jusqu’à 16 secondes à un rythme de 16 images par seconde. L’outil peut également générer des vidéos hautement personnalisées à partir d’une seule photo combinée à une instruction textuelle descriptive.

En plus de l’édition vidéo, la solution IA de Meta peut également créer des sons ambiants, de la musique de fond et des effets sonores pour accompagner les vidéos générées ou pré-créées. À l’instar de ses capacités de génération vidéo, la génération audio de Movie Gen est alimentée par des entrées textuelles définies par l’utilisateur.

Le post met en avant plusieurs exemples de ses capacités audio, incluant un VTT roulant à travers des dunes de sable, un skateboarder évoluant dans un skatepark, et des pingouins nageant dans un plan d’eau généré par IA rempli de grandes sphères flottantes.
Malgré l’affirmation de Zuckerberg selon laquelle cette nouvelle fonctionnalité pourrait être disponible pour les utilisateurs d’Instagram l’année prochaine, un post sur Threads par le Chief Product Officer de Meta, Chris Cox, a clarifié l’état actuel de Movie Gen. Cox a expliqué que Meta intègre les retours des cinéastes et des créateurs de vidéos pour prioriser des fonctionnalités comme des capacités d’édition améliorées et la possibilité de générer des vidéos avec un personnage ou une image spécifique.
Bien que l’aperçu semble montrer que Movie Gen offre déjà ces fonctionnalités, Cox a mentionné que l’équipe n’est pas prête à les lancer comme un produit. Selon lui, « …c’est encore cher, et le temps de génération est trop long – mais nous voulions partager où nous en sommes puisque les résultats deviennent assez impressionnants. »
