On pourrait créer des robots comme Rosie des Jetsons
Que vient-il de se passer ? Des chercheurs du Massachusetts Institute of Technology (MIT) ont développé une nouvelle approche pour former des robots à usage général, en s'inspirant du succès de grands modèles de langage comme GPT-4. Appelée transformateurs pré-entraînés hétérogènes (HPT), cette approche permet aux robots d'apprendre et de s'adapter à un large éventail de tâches, ce qui était difficile jusqu'à présent.
La recherche pourrait conduire à un avenir dans lequel les robots ne seraient pas seulement des outils spécialisés mais aussi des assistants flexibles capables d’acquérir rapidement de nouvelles compétences et de s’adapter à l’évolution des circonstances, devenant ainsi de véritables assistants robotiques à usage général.
Traditionnellement, la formation des robots est un processus long et coûteux, obligeant les ingénieurs à collecter des données spécifiques pour chaque robot et chaque tâche dans des environnements contrôlés. En conséquence, les robots auraient du mal à s’adapter à de nouvelles situations ou à des obstacles inattendus.
La nouvelle technique de l'équipe du MIT combine de grandes quantités de données hétérogènes provenant de diverses sources en un seul système capable d'enseigner aux robots un large éventail de tâches.
Au cœur de l'architecture HPT se trouve un transformateur, un type de réseau neuronal qui traite les entrées de divers capteurs, y compris les données de vision et de proprioception, et crée un « langage » partagé que le modèle d'IA peut comprendre et dont il peut apprendre.
« En robotique, les gens prétendent souvent que nous n'avons pas suffisamment de données d'entraînement. Mais à mon avis, un autre problème majeur est que les données proviennent de nombreux domaines, modalités et matériels robotiques différents », a déclaré Lirui Wang, l'auteur principal. de l'étude et étudiant diplômé en génie électrique et informatique (EECS) au MIT. « Notre travail montre comment vous pourriez entraîner un robot avec tous ces éléments réunis. »
Les co-auteurs de Wang incluent Jialiang Zhao, étudiant diplômé de l'EECS, Xinlei Chen, chercheur en méta, et l'auteur principal Kaiming He, professeur agrégé à l'EECS et membre du Laboratoire d'informatique et d'intelligence artificielle (CSAIL). La recherche sera présentée à la Conférence sur les systèmes de traitement de l'information neuronale.
L'un des principaux avantages de l'approche HPT est sa capacité à exploiter un ensemble massif de données pour la pré-formation. Les chercheurs ont compilé un ensemble de données composé de 52 ensembles de données avec plus de 200 000 trajectoires de robots réparties en quatre catégories, y compris des vidéos de démonstration humaine et des simulations.
Cette pré-formation permet au système de transférer efficacement les connaissances lors de l'apprentissage de nouvelles tâches, ne nécessitant qu'une petite quantité de données spécifiques à la tâche pour un réglage précis.
Dans les tâches simulées et réelles, la méthode HPT a surpassé de plus de 20 % les approches traditionnelles de formation à partir de zéro. Le système HPT a toujours démontré des performances améliorées, même face à des tâches très différentes des données de pré-entraînement.
« Cet article propose une nouvelle approche pour former une politique unique sur plusieurs modes de réalisation de robots », a déclaré David Held, professeur agrégé à l'Institut de robotique de l'Université Carnegie Mellon, qui n'a pas participé à l'étude. « Cela permet l'entraînement sur divers ensembles de données, ce qui permet aux méthodes d'apprentissage des robots d'augmenter considérablement la taille des ensembles de données sur lesquels ils peuvent s'entraîner. Cela permet également au modèle de s'adapter rapidement aux nouveaux modes de réalisation de robots, ce qui est important car de nouvelles conceptions de robots sont continuellement produites. « .
Les chercheurs du MIT visent à améliorer le système HPT en explorant comment la diversité des données peut améliorer ses performances. Ils prévoient également d'étendre les capacités du système pour traiter des données non étiquetées, de la même manière que fonctionnent de grands modèles de langage comme GPT-4.
Wang et ses collègues se sont fixé un objectif ambitieux pour l'avenir de cette technologie. « Notre rêve est d'avoir un cerveau de robot universel que vous pourriez télécharger et utiliser pour votre robot sans aucune formation », a expliqué Wang. « Bien que nous n'en soyons qu'aux premiers stades, nous allons continuer à pousser fort et espérer que la mise à l'échelle conduira à une percée dans les politiques robotiques, comme cela a été le cas avec les grands modèles de langage. »
L’Amazon Greater Boston Tech Initiative et le Toyota Research Institute ont financé en partie cette recherche.