Suivre les progrès de l’IA est épuisant

Nous sommes dans un moment historique sans précédent. Certaines applications d’IA se développent si rapidement qu’il reste à peine le temps de traiter une nouvelle technologie alors que la suivante est déjà arrivée pour la surpasser. Il y a un peu plus d’un mois, Stable Diffusion se présentait comme une IA libre et open Source. Une vraie révolution.

La semaine dernière, DreamBooth a changé la façon dont nous utilisons Stable Diffusion, car le système nous permet de former l’IA avec notre visage ou tout type de concept qui nous vient à l’esprit. DreamBooth nécessitait à l’origine du matériel professionnel Nvidia, mais en quelques heures, la communauté a créé tellement de fourches qu’il est devenu possible d’exécuter le programme sur un ordinateur personnel. Ce n’était pas non plus la seule nouvelle importante de la semaine. Meta a également montré au monde ses avancées dans ce secteur. Ils ont montré une série de courtes vidéos de figures générées par l’IA. Comme nous l’avons dit, Google n’a pas mis longtemps à vaincre ses concurrents.

Google fait un pas en avant avec le ‘text to video’

Il y a quelques semaines, le vulgarisateur Carlos Santana (dotcsv) soulevait sur YouTube si c’était possible faire un film avec une IA. Dans sa présentation, l’expert en intelligence artificielle a vu que le scénario était encore compliqué, mais pas impossible.

Comme on dit, ce monde avance à un rythme très effréné. Pas plus tard qu’hier, Google a présenté au monde Image Video, une intelligence artificielle capable de générer de courtes vidéos à l’aide d’une commande de texte en langage naturel. Le projet a été présenté sur Twitter par Jonathan Ho. Le programmeur a montré une courte vidéo de cinq secondes de feuilles tombant dans un lac qui formait les mots « Image Video ». À première vue, cela ne semble rien de spectaculaire, mais la vérité est qu’à ce jour, pratiquement aucune des IA que nous connaissons ne sait comment générer du texte dans des images.

Jonathan Ho @hojonathanho Ravi d’annoncer Image Video, notre nouveau modèle de diffusion vidéo conditionné par texte qui génère des vidéos HD 1280×768 24fps ! #ImageVidéo

Le lien dans le post en montre un peu plus sur cette technologie. Il s’agit d’une application supplémentaire de Google Image Research, qui fonctionne de manière très similaire à Dall-E 2. Google Image Video vous permet de créer des clips avec une résolution HD (1280 par 768 pixels) à 24 images par seconde. La différence avec ce que Meta a montré la semaine dernière est notable, car la société de Mark Zuckerberg a simplement montré quelques rendus d’objets vectoriels qui tournent autour d’une caméra. Pas du tout, un résultat aussi saisissant et utile que cette technologie que Mountain View vient de présenter.

Le but de ce post est clairement de montrer au monde qu’ils sont en avance sur Meta dans ce domaine. Cependant, il est encore tôt pour savoir quels sont les projets futurs de Google avec ce programme.