La fin des robots rudimentaires : la nouvelle IA de Google DeepMind qui apprend à plier du linge

La fin du robot incompétent : la nouvelle IA de Google DeepMind qui permet aux robots de 'penser' et de plier le linge

Les récentes avancées de Google DeepMind dans l’intelligence artificielle appliquée aux robots montrent des promesses fascinantes. Grâce à la collaboration de modèles innovants, les robots acquièrent des capacités de raisonnement, leur permettant d’effectuer des tâches complexes qui étaient auparavant inimaginables.

Google, grâce à DeepMind, a publié ses avancées en matière d’IA appliquée aux robots, des découvertes et des réalisations particulièrement prometteuses

La fin du robot incompétent : la nouvelle IA de Google DeepMind qui permet aux robots de 'penser' et de plier le linge
L’IA contribuera également au monde physique grâce aux robots programmés par Google

La prochaine étape dans l’évolution de l’IA pourrait être l’application directe de celle-ci à des entités matérielles comme les robots. L’IA générative atteint des niveaux de création de contenu inimaginables, et son intégration dans les robots marque une avancée significative. C’est le projet Gemini Robotics récemment annoncé par Google DeepMind, qui utilise deux nouveaux modèles collaborant pour doter les robots de capacités de réflexion avant d’agir.

Les avancées récentes des robots dotés d’IA grâce au projet Gemini Robotics

Une partie de ce fonctionnement repose sur l’amélioration des modèles de langage à grande échelle, en y intégrant le raisonnement. Selon Google DeepMind, l’IA générative joue un rôle clé dans la robotique en permettant de « débloquer des fonctionnalités générales ». Les robots conçus avant l’avènement de l’IA nécessitent un entraînement intensif pour exécuter des tâches et présentent souvent des défaillances dans d’autres domaines pour lesquels ils n’ont pas été programmés.

Youtube video

Carolina Parada, responsable de la robotique chez Google DeepMind, a déclaré que « il faut des mois pour installer une seule cellule capable de réaliser une tâche ». Avec l’IA, le cadre de travail pourrait changer sans avoir besoin de programmation, même face à des tâches ou situations inédites. Les deux modèles évoqués par Google DeepMind sont dédiés à la pensée et à l’action, appelés Gemini Robotics 1.5 et Gemini Robotics-ER 1.5. Le premier est un modèle de « vision-langage-action » qui génère des actions pour le robot, et le second intègre le raisonnement.

Comment seront les robots de demain avec l’IA ?

Google illustre avec un exemple concret qui fait partie de notre quotidien : trier le linge à laver. Comment diriez-vous à un robot du futur de le faire ? La première étape est de séparer le linge blanc du couleur en deux tas. Que ferait le robot ? Gemini Robotics-ER 1.5 effectuerait cette opération à l’aide d’images de son environnement, générant des instructions en langage naturel pour mener à bien la tâche.

Youtube video

Gemini Robotics 1.5 utilisera ces instructions pour exécuter la tâche, tout en s’appuyant sur des informations visuelles pour guider ses mouvements. Ce modèle utilisera son raisonnement pour accomplir la demande. Google DeepMind travaille sur les modèles de Gemini en les perfectionnant pour s’adapter à l’environnement physique, permettant ainsi aux robots d’exécuter à l’avenir des tâches plus complexes. Un autre exemple a été donné avec le tri des déchets : compost, recyclage et ordures classiques.

Diagramme qui explique les modèles d'IA de Google dans les robots

Les modèles de raisonnement et de vision-langage-action interagissant en synergie

Google teste déjà ces avancées avec deux robots, Aloha 2 et Apollo, qui ressemble à un humanoïde. Bien que nous soyons encore loin d’avoir un robot capable d’effectuer des actions humaines, ces progrès témoignent d’une direction prometteuse pour la création d’instructions robotiques efficaces pour les robots physiques. Il y a quelques mois, Google DeepMind a réalisé des tests avec le modèle Gemini 2.0, proposant une tâche surprenante : ranger un chapeau dans un sac pour un voyage à Londres. Le robot savait qu’il allait pleuvoir, alors il a aussi pris un parapluie.