Google's DeepMind créa trois modèles sophistiqués pour le développement de robots
JAKARTA – Google DeepMind, une société d’intelligence artificielle (IA) d’Alphabet, fait de nouveaux progrès dans le monde de la robotique. Ils construisent trois systèmes comme base initiale du robot.
Les systèmes qu’ils ont construits sur la base des modèles de transformateurs de robot (RT) sont AutoRT, SARA-RT et RT Trajectory. Ces trois systèmes sont censés être en mesure de permettre aux robots de travailler plus rapidement, que ce soit dans la prise de décision ou dans la navigation environnementale.
L’AutoRT est un système qui utilise le potentiel de modèles de base importants. Ce système est considéré comme une partie importante des robots car il combine de grands modèles de base tels que le gros modèle de langage (LLM) et les modèles de pilote, à savoir RT-1 et RT-2.
En utilisant AutoRT, les développeurs de robots peuvent améliorer l’apprentissage de la robotique pour entraîner les contrôles de plusieurs robots simultanément. Ce système peut diriger les robots à effectuer diverses tâches dans divers paramètres.
« Ce système gère en toute sécurité jusqu’à 20 robots à la fois, et un total de 52 robots uniques, dans divers bâtiments de bureau, recueillant divers ensemble de données composés de 77 000 essais robotiques dans 6 650 tâches uniques », a déclaré l’équipe de robotique de Google de DeepMind. Pendant ce temps, l’attention robuste autoadaptative pour les transformateurs de robots (SARA-RT) est une architecture réseau nerveux RT développée de manière plus sophistiquée. Ce modèle est censé être plus précis de 10,6% et 14% plus rapide que le modèle RT-2.
SARA-RT qui utilise une méthode d’amélioration de nouveaux modèles, à savoir la formation, peut rendre les modèles de robot plus efficaces. De plus, les robots qui utilisent cette architecture réseau peuvent permettre aux robots de travailler plus rapidement conformément à leurs tâches.
« Nous avons conçu nos systèmes pour rendreus faciles à utiliser et nous espérons que de nombreux chercheurs et praticiens l’appliqueront dans la robotique et d’autres, car la SARA offre une recette universelle pour accélérer les transformateurs », a expliqué l’équipe.
Un autre modèle qui n’est pas moins important est RT-Trajectory, qui est un modèle qui ajoute des lignes visuelles pour décrire les mouvements du robot dans une vidéo d’entraînement. Ce modèle prendra une collection de données de formation et le recouvrira d’un élève de pistes 2D.
Cette piste en forme de RGB fournira des indices visuels pratiques à bas niveau. Dans un essai mené par DeepMind, RT-Trajectory a réussi à doubler les performances du robot avec un taux de réussite de 63.
« TR-Trajectory peut faire une piste en regardant les manifestations humaines sur la tâche souhaitée et même en recevant des croquis dessinés à la main. Et il peut facilement être adapté à différentes plates-formes de robot », a conclu l’équipe de Robotics de DeepMind.