Google présente Genie 2, un modèle révolutionnaire en intelligence artificielle générative, qui promet de transformer la création universelle en permettant aux utilisateurs sans compétences en construction de mondes de donner vie à leurs idées rapidement. Découvrez comment cette technologie peut redéfinir l’expérience interactive à travers des environnements 3D infinis.
Le nombre de cas d’utilisation potentiels des outils d’IA générative augmente rapidement. Avec son modèle récemment introduit dans la ligne Genie, Google souhaite maintenant offrir aux « créateurs » n’ayant aucune compétence en construction de mondes un moyen simple et rapide de prototyper leurs idées.
Genie 2 est un nouveau modèle fondamental capable de générer une quantité « infinie » d’environnements 3D pouvant être contrôlés par l’utilisateur, selon Google. L’IA générative peut créer un monde virtuel entier à partir d’un simple texte et d’une image d’exemplaire, qui peuvent être réalisés par l’utilisateur ou générés par des modèles d’IA externes.
D’autres entreprises tentent de transformer la technologie d’IA générative en une merveille de construction de mondes, bien que les résultats puissent varier. L’expérience Oasis a été conçue pour générer une expérience similaire à Minecraft image par image, mais elle ressemble actuellement à un monde Minecraft basse définition affecté par une forme de démence. Genie 2 peut maintenir un monde apparemment cohérent pendant jusqu’à une minute, assure Google, bien que nous parlions toujours d’un visuel basse résolution, brouillé et très désagréable à regarder.
Quoi qu’il en soit, Google ne semble pas du tout intéressé par les problèmes de répulsion visuelle ou de vallée dérangeante. Mountain View a déclaré que les jeux jouent un rôle clé dans la recherche en IA, offrant un environnement idéal pour tester de nouvelles capacités. Les mondes de Genie 2 peuvent être contrôlés par un humain utilisant une simple combinaison de clavier et de souris, l’IA générative simulant toutes les conséquences des actions des joueurs.

Contrairement au récemment dévoilé SIMA, Genie 2 peut fournir des réactions visuelles « intelligentes » dans un environnement virtuel généré sans fin. Le modèle d’IA peut générer différents parcours, ou « expériences contrefactuelles » pour entraîner les agents, à partir du même cadre de base. Avec différentes actions entreprises par le joueur humain, le monde environnant change et hallucine en conséquence.
Genie 2 peut également se souvenir des parties précédemment générées du monde virtuel qui sont hors du champ de vision du joueur, et même les rendre « précisément » lorsqu’elles reviennent dans le cadre. Le modèle peut créer différentes perspectives de joueur, y compris des vues à la première personne, des vues isométriques et des cockpits de conduite à la troisième personne. Des structures 3D complexes et des interactions entre objets font également partie de l’ensemble.
Les capacités supplémentaires du nouveau modèle fondamental incluent l’animation de personnages, les PNJ, la physique, la fumée, la gravité, l’éclairage et les reflets. Google a déclaré que Genie 2 et des technologies similaires en IA générative pourraient être utiles pour prototyper et expérimenter des expériences interactives, le jeu étant la première application potentielle qui vient à l’esprit. La recherche est encore à ses débuts, ce qui signifie qu’il y a beaucoup de place pour l’amélioration lors des prochaines sessions d’entraînement du modèle.
