Des chercheurs du MIT ont dévoilé une méthode novatrice, les Heterogeneous Pretrained Transformers, qui inspire les robots à apprendre diverses compétences de manière flexible. Cet avancement pourrait transformer les robots en assistants polyvalents, capable de s’adapter et d’apprendre rapidement, révolutionnant ainsi leur utilisation future.
Qu’est-ce qui vient de se passer ? Des chercheurs du Massachusetts Institute of Technology (MIT) ont développé une nouvelle approche pour former des robots polyvalents, s’inspirant du succès des grands modèles de langage comme GPT-4. Appelée Heterogeneous Pretrained Transformers (HPT), cette méthode permet aux robots d’apprendre et de s’adapter à une large gamme de tâches – ce qui a été difficile jusqu’à présent.
Cette recherche pourrait mener à un avenir où les robots ne sont pas seulement des outils spécialisés, mais de véritables assistants flexibles capables d’apprendre rapidement de nouvelles compétences et de s’adapter à des circonstances changeantes, devenant ainsi des assistants robotiques véritablement polyvalents.
Traditionnellement, la formation des robots est un processus long et coûteux, nécessitant que les ingénieurs collectent des données spécifiques pour chaque robot et tâche dans des environnements contrôlés. En conséquence, les robots ont du mal à s’adapter à de nouvelles situations ou à des obstacles inattendus.
La nouvelle technique de l’équipe du MIT combine d’énormes quantités de données hétérogènes provenant de diverses sources dans un seul système capable d’enseigner une vaste gamme de tâches aux robots.
Au cœur de l’architecture HPT se trouve un transformateur, un type de réseau de neurones qui traite les entrées provenant de divers capteurs, y compris les données visuelles et de proprioception, et crée un « langage » partagé que le modèle d’IA peut comprendre et apprendre.

« Dans le domaine de la robotique, beaucoup affirment que nous n’avons pas suffisamment de données d’entraînement. Mais, à mon test, un autre problème majeur est que les données proviennent de nombreux domaines, modalités et matériels robotiques différents », a déclaré Lirui Wang, l’auteur principal de l’étude et étudiant diplômé en ingénierie électrique et informatique (EECS) au MIT. « Notre travail démontre comment il serait possible de former un robot avec toutes ces données rassemblées. »
Les co-auteurs de Wang comprennent son camarade d’études Jialiang Zhao, le scientifique de recherche de Meta Xinlei Chen, et l’auteur senior Kaiming He, professeur associé en EECS et membre du Computer Science and Artificial Intelligence Laboratory (CSAIL). La recherche sera présentée lors de la Conférence sur les Systèmes de Traitement de l’Information Neuronale.
L’un des principaux avantages de l’approche HPT est sa capacité à tirer parti d’un ensemble de données massif pour le préentraînement. Les chercheurs ont compilé un jeu de données composé de 52 ensembles de données avec plus de 200 000 trajectoires robotiques dans quatre catégories, y compris des vidéos de démonstration humaine et des simulations.
Ce préentraînement permet au système de transférer des connaissances efficacement lors de l’apprentissage de nouvelles tâches, n’exigeant qu’une petite quantité de données spécifiques à la tâche pour un ajustement fin.
Dans des tâches simulées et réelles, la méthode HPT a surpassé les approches traditionnelles basées sur un entraînement de zéro de plus de 20 %. Le système HPT a également montré des performances améliorées, même lorsqu’il a été confronté à des tâches significativement différentes des données de préentraînement.
« Cet article propose une approche novatrice pour entraîner une seule politique à travers plusieurs incarnations robotiques », a déclaré David Held, professeur associé à l’Institut de Robotique de l’Université Carnegie Mellon, qui n’était pas impliqué dans l’étude. « Cela permet d’entraîner à travers des ensembles de données divers, permettant aux méthodes d’apprentissage des robots d’augmenter significativement la taille des ensembles de données qu’elles peuvent utiliser pour s’entraîner. Cela permet également au modèle de s’adapter rapidement à de nouvelles incarnations robotiques, ce qui est crucial alors que de nouveaux designs robotiques continuent d’émerger. »
Les chercheurs du MIT visent à améliorer le système HPT en explorant comment la diversité des données peut renforcer ses performances. Ils prévoient également d’étendre les capacités du système pour traiter des données non étiquetées, à l’instar de la manière dont fonctionnent les grands modèles de langage comme GPT-4.
Wang et ses collègues se sont fixés un objectif ambitieux pour l’avenir de cette technologie. « Notre rêve est d’avoir un cerveau robot universel que vous pourriez télécharger et utiliser pour votre robot sans aucune formation », a expliqué Wang. « Bien que nous ne soyons encore qu’aux premiers stades, nous allons continuer à progresser et espérons que l’échelle conduira à une avancée dans les politiques robotiques, comme cela a été le cas avec les grands modèles de langage. »
L’initiative Amazon Greater Boston Tech et l’Institut de recherche Toyota ont partiellement financé cette recherche.
