Nvidia est prête à dévoiler la puce IA « Feynman » et une nouvelle stratégie lors de la conférence GTC
JAKARTA - Le PDG d’Nvidia, Jensen Huang, doit dévoiler la nouvelle feuille de route de l’entreprise dans le développement de l’intelligence artificielle lors de la conférence annuelle des développeurs Nvidia GTC qui se tiendra à San Jose, en Californie, lundi 16 mars.
Dans son discours principal, qui a eu lieu dans une arène de hockey avec une capacité de plus de 18 000 personnes, Huang devrait exposer la stratégie de l’entreprise face à des changements rapides dans le paysage industriel mondial de l’IA, y compris les plans de développement de la nouvelle génération de puces et de logiciels qui soutiennent l’écosystme de l’intelligence artificielle.
La société de semi-conducteurs Nvidia, qui est actuellement la plus grande entreprise publique au monde avec un capitalisation boursière de plus de 4,3 billions de dollars, devrait introduire la prochaine génération de puces IA appelée Feynman. Le nom du chip est tiré du physicien américain Richard Feynman, un scientifique connu pour sa contribution à la mécanique quantique et à la relativité quantique.
Outre l’annonce de la nouvelle puce, Huang devrait également discuter de l’avancement des centres de données basés sur l’IA, de la plate-forme de programmation CUDA de Nvidia, ainsi que de l’évolution de la technologie des assistants numériques qui se développe maintenant en « agents IA ». Cette technologie permet aux systèmes d’intelligence artificielle non seulement de répondre à des questions, mais également de mener à bien des tâches automatiquement.
La conférence devrait également mettre en lumière le concept d’ « IA physique », c’est-à-dire l’intégration de l’intelligence artificielle dans des machines physiques telles que des robots industriels et des robots de service qui peuvent fonctionner de manière autonome.
L’une des autres priorites est la collaboration d’Nvidia avec la start-up de puces Groq. En decembre, Nvidia a licencíé la technologie de l’entreprise dans un accord d’une valeur d’environ 17 milliards de dollars.
Groq est connu pour développer des processeurs optimisés pour le calcul « d’inférence », c’est-à-dire le processus lorsque les modèles d’IA utilisent les connaissances apprises pour produire des réponses ou des prédictions en temps réel. Ce segment est de plus en plus important car les entreprises technologiques passent de l’étape de formation des modèles d’IA à la fourniture de services d’IA à des centaines de millions d’utilisateurs.
Au cours des dernières années, des entreprises telles que OpenAI, Anthropic, ainsi que le propriétaire de Facebook Meta Platforms ont dépensé des centaines de milliards de dollars pour former des modèles d'IA à grande échelle.
Cependant, l’industrie se concentre maintenant sur la phase suivante, à savoir la mise en place du modèle pour servir les utilisateurs à grande échelle. Ces changements ont rendu la concurrence sur le marché des puces d’inférence plus serrée que sur le marché des puces pour la formation de l’IA, qui a été dominé par Nvidia.
Bien qu'il soit confronté à une concurrence croissante - y compris de la part de plusieurs grands clients qui commencent à concevoir leurs propres puces - Nvidia occupe toujours une position centrale dans l'écosystème mondial de l'IA.
Plusieurs pays, dont l'Arabie saoudite, construisent même des systèmes d'intelligence artificielle nationaux utilisant des puces Nvidia pour répondre aux besoins de leur population.
En outre, Nvidia est également l’une des grandes entreprises technologiques américaines qui publie toujours des logiciels open-source d’IA, un domaine qui est maintenant le champ de bataille de la concurrence stratégique entre les États-Unis et la Chine dans le développement de la technologie d’intelligence artificielle.