NVIDIA lance un modèle d’IA de développement de véhicules autonomes et de robots, quels sont les avantages?
ARTA - Lors du CES 2025, NVIDIA a lancé NVIDIA Cosmos, une plate-forme sophistiquée conçue pour encourager le développement de systèmes d’IA physiques tels que les véhicules autonomes (AV) et les robots.
NVIDIA Cosmos est censé aider les développeurs à répondre aux défis de la création de modèles d’IA physiques qui nécessitent beaucoup de coûts à développer, nécessitent beaucoup de données du monde réel et des essais approfondi.
Met cosmos, les développeurs peuvent facilement créer de grandes quantités de données synthétiques photréalistes sur la base de la physique pour entraîner et évaluer leurs modèles. En outre, ils peuvent également adapter leurs modèles avec des ajustements supplémentaires.
» Le moment de chatGPT pour la robotique viendra bientôt. Comme le grand modèle de langue, le modèle de base mondial est très important pour faire progresser le développement du robot et de l’AV, mais tous les développeurs ne disposent pas des expériences et des ressources pour se former », a déclaré Jensen Huang, fondateur et PDG d’Nvidia.
cosmos est disponible sous licence ouverte pour soutenir la communauté de la robotique et de l’automobile. Un certain nombre de grandes entreprises de la robotique et de l’automobile telles que Uber, XPENG, Agility et Waabi ont également adopté Cosmos pour accélérer leur développement technologique.
« Nous avons créé Cosmos pour démocratiser l’IA physique et mettre la robotique commune dans le portée de chaque développeur », a ajouté Jensen.
NVIDIA Cosmos offre une variété de fonctionnalités phares, y compris la production de vidéos basées sur la physique à partir d’une combinaison d’entrées telles que texte, images, vidéos et de données de capteurs du robot.
NVIDIA Cosmos Tokenizer est également en mesure de convertir des images et des vidéos en jetons avec une efficacité de 12 fois plus rapide que d’autres jetons.
Avec l’aide du Curator NeMo de NVIDIA et de la plate-forme Nvidia Blackwell, le pipelines peut traiter 20 millions d’heures de vidéos en 14 jours, contre plus de trois ans s’il ne s’agit que de la processeur.
rénal. Les développeurs peuvent utiliser Cosmos pour former des modèles, les améliorer par un apprentissage renforcé ou tester leurs performances dans divers scénarios de simulation.