Microsoft lance Maia 200, une puce pour optimiser les modèles d'IA de grande taille
JAKARTA - Microsoft a introduit Maia 200, une deuxième génération de puces d’intelligence artificielle (IA) qui est la première puce à la performance la plus élevée actuellement. Ce puce est fabriqué en 3nm.
Maia 200 propose un système de mémoire HBM3e de 216 Go avec une vitesse de transfert atteignant 7 To/s. Le matériel est également équipé d’un cœur tensor FP8/FP4 natif capable de maintenir les modèles AI de grande taille en fonctionnement optimal et rapide.
Les performances de cette puce répondent au défi de ses concurrents sur le marché mondial, y compris Vera Rubin de Nvidia. La capacité FP4 de Maia 200 est enregistrée trois fois plus forte que celle d’Amazon Trainium 3, tandis que sa performance FP8 est supérieure à celle du TPU de Google de la septième génération.
« Maia 200 est également le système d’infertilisation le plus efficace jamais mis en œuvre par Microsoft, avec une performance 30% meilleure par dollar que le matériel de nouvelle génération de notre flotte actuelle », a expliqué Microsoft dans son blog officiel, cité mardi 27 janvier.
Chaque puce peut contenir plus de 140 milliards de transistors pour gérer des calculs complexes à faible précision. Maia 200 est capable de fournir plus de 10 petaFLOPS de performance à une précision de 4 bits pour offrir plus d’espace aux modèles d’IA plus massifs.
Maia 200 dispose d'un système de refroidissement liquide en boucle fermée de deuxième génération qui assure que la température du dispositif est maintenue. Grâce à la validation du système de bout en bout, le temps de déploiement des puces de l'usine au centre de données peut être deux fois plus rapide.
Microsoft explique que cette puce permettra de soutenir de nombreux modèles d’IA avancés, dont GPT-5.2 d’OpenAI. L’équipe interne de Microsoft l’utilisera également pour la création de données synthétiques et le processus d’apprentissage de renforcement des modèles de prochaine génération.
Ces puces sont utilisées dans un centre de données nommé US Central qui se situe à Iowa. Microsoft utilisera aussi ces puces dans la zone US West 3 qui se situe en Arizona. Il n’est pas encore certain quand les deux sites utiliserânt ces puces.