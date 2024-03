Alibaba, le géant chinois du commerce en ligne, a fait un pas qui a surpris énormément d’experts et d’enthousiastes en présentant EMO. Le nom fait référence à ‘Emote Portrait Alive’ et se traduit par une technologie basée sur l’IA pour créer des vidéos à partir d’images. EMO est l’IA générative d’Alibaba qui débarque sur un marché qui ne semble pas saturé de propositions basées sur l’IA.

Ce que fait EMO se résume à donner vie à n’importe quelle photo, en générant une vidéo ultra-réaliste dans laquelle la personne représentée parle ou chante. Alibaba a créé une page officielle pour EMO où il montre en détail comment l’IA est capable d’accomplir cette tâche et donne surtout des exemples des différentes applications pour cet outil.

Le projet a été développé par Linrui Tian, Qi Wang, Bang Zhang et Liefng Bo, chercheurs à l’Institut d’Intelligence Informatique d’Alibaba. Cette équipe a réussi à lancer dans le monde une IA qui peut rivaliser avec Sora, le projet d’OpenAI. Selon l’équipe de chercheurs, EMO est capable de créer des mouvements faciaux expressifs, naturels et fluides.

Tout cela se traduit par des résultats extrêmement réalistes, faisant en sorte qu’un tableau puisse prendre vie et qu’il y ait peu d’éléments qui révèlent son origine. Logiquement, tout cela dans le cadre où l’on prend en compte les autres outils destinés à cette tâche.

Nous proposons EMO, un cadre de génération de portraits et de vidéos expressifs basés sur l’audio. À partir d’une seule image de référence et de l’audio vocal, par exemple, parler et chanter, notre méthode peut générer des vidéos d’avatars vocaux avec des expressions faciales expressives et diverses postures de la tête.