OpenAI commence à chercher des chips de remplacement d'Nvidia, la domination du géant des GPU est mise à l'essai
JAKARTA - Les relations entre les deux plus grandes stars de l’explosion de l’intelligence artificielle mondiale, OpenAI et Nvidia, commencent à montrer des fissures. OpenAI est dit insatisfait de certaines des dernières puces IA d’Nvidia et cherche activement depuis l’an dernier un substitut.
Cette insatisfaction pourrait compliquer les relations entre les créateurs de ChatGPT et le fabricant de puces le plus dominant dans le monde de l'IA, d'autant plus que les deux parties sont encore engagées dans des discussions d'investissement de gros.
Le changement de stratégie d'OpenAI est centré sur l'accent accru sur les puces d'infertilisation, c'est-à-dire les puces utilisées lorsque les modèles IA répondent aux demandes des utilisateurs en temps réel. Nvidia domine toujours les puces pour la formation de modèles IA à grande échelle, mais l'infertilisation est maintenant un nouveau champ de bataille beaucoup plus sensible à la vitesse et à l'efficacité.
La décision d’OpenAI de trouver une alternative sur le marché des puces d’inferencing est un test réel pour la domination d’Nvidia, en particulier dans le cadre des négociations d’investissement entre les deux entreprises. En septembre 2025, Nvidia a exprimé son intention d’investir jusqu’à 100 milliards de dollars américains dans OpenAI, ce qui lui donnerait une participation et assurerait à OpenAI les fonds nécessaires pour acheter des puces de pointe.
L’accord devait initialement être achevé en quelques semaines. Cependant, le processus a duré des mois. Au cours de cette période, OpenAI a en fait noué des partenariats avec AMD et d’autres pour des GPU conçus pour rivaliser avec Nvidia. Une source a dit que le changement de feuille de route de produits OpenAI a également modifié les besoins en informatique et a compliqué les négociations avec Nvidia.
Le PDG d’Nvidia, Jensen Huang, a auparavant nié les rumeurs de tensions avec OpenAI. « C’est de la connerie », a dit Huang, tout en affirmant que Nvidia avait toujours l’intention d’investir massivement dans OpenAI.
Dans une déclaration distincte, Nvidia a déclaré: «Les clients continuent de choisir NVIDIA pour l’infertilisation car nous fournissons les meilleures performances et le coût total de possession le plus efficace à grande échelle. »
Le porte-parole d’OpenAI a également insisté sur le fait que l’entreprise s’appuyait toujours sur Nvidia pour la majorité de sa flotte d’inferencing. « Nvidia offre le meilleur rapport performance-dollar pour l’inferencing », a déclaré le porte-parole.
Le PDG d’OpenAI, Sam Altman, a également étouffé les spéculations. Dans une publication sur la plate-forme X, il a dit que Nvidia fabriquait « les meilleurs chips IA du monde » et que OpenAI espérait rester « un client géant pendant très longtemps ».
Mais derrière cette déclaration publique calme, sept sources ont dit qu'OpenAI n'était pas satisfait de la vitesse des puces Nvidia dans la production de réponses de ChatGPT pour certains types de tâches, comme le développement de logiciels et la communication entre les systèmes d'IA. OpenAI est censé avoir besoin de nouveaux matériels qui peuvent fournir environ 10% de ses besoins en calcul d'inférence.
OpenAI a exploré une collaboration avec des startups de puces telles que Cerebras et Groq, connues pour développer des puces d’inferencing à haute vitesse. Cependant, les discussions avec Groq ont pris fin après que Nvidia a signé un accord de licence de 20 milliards de dollars avec la société, selon une source.
La licence de la technologie Groq et le recrutement de talents clés par Nvidia sont considérés comme des tentatives pour renforcer le portefeuille technologique dans un secteur de l’IA en pleine croissance. Nvidia a déclaré que la propriété intellectuelle de Groq complétait parfaitement son plan de produits.
L'attention d'OpenAI sur les alternatives aux GPU depuis l'an dernier est tournée vers des puces avec une grande mémoire intégrée directement dans le silicium, connue sous le nom de SRAM. Cette architecture offre un avantage en termes de vitesse pour les chatbots et les systèmes d'IA qui doivent servir des millions de demandes d'utilisateurs simultanément.
L'infertilisation nécessite plus de mémoire que la formation, car les puces prennent plus souvent des données de la mémoire que de faire des calculs mathématiques. Les GPU Nvidia et AMD dépendent toujours de la mémoire externe, ce qui augmente la latence et ralentit la réponse.
Au sein d'OpenAI, le problème est le plus ressenti par Codex, un produit d'IA pour l'écriture de code qui est maintenant fortement commercialisé. Une source a dit que certaines des faiblesses de Codex étaient liées aux limitations du matériel informatique basé sur les GPU Nvidia.
Lors d’une conférence téléphonique avec des journalistes le 30 janvier, Altman a insisté sur le fait que la vitesse était un facteur crucial pour les utilisateurs du modèle d’IA pour le codage. « Les utilisateurs accordent une grande prime à la vitesse pour le travail de programmation », a-t-il dit.
Altman a dit qu’une des façons dont OpenAI répondait à ces exigences était par son dernier partenariat avec Cerebras. Selon lui, les besoins d’une vitesse extrême ne s’appliquent pas toujours aux utilisateurs occasionnels de ChatGPT.
En attendant, les concurrents d'OpenAI comme Anthropic avec Claude et Google avec Gemini profitent de l'utilisation de puces internes fabriquées maison, des unités de traitement de tenseurs ou TPU, conçues spécifiquement pour l'inférence et souvent plus efficaces que les GPU polyvalents.
Il est intéressant de noter que lorsque OpenAI a commencé à exprimer ses doutes sur la technologie Nvidia, Nvidia a approché les entreprises de développement de puces SRAM, dont Cerebras et Groq, pour une acquisition éventuelle. Cerebras a refusé et a choisi une coopération commerciale avec OpenAI annoncée le mois dernier.
Groq a lui-même discuté avec OpenAI et a attiré l’attention des investisseurs avec une valeur d’environ 14 milliards de dollars. Mais en decembre, Nvidia a agité rapidement en licenciant la technologie Groq dans un accord non exclusif en liquide, tout en recrutant ses principaux concepteurs de puces.
En bref, dans le sillage de la flambée mondiale de l'IA, même les géants commencent à jeter un coup d'œil aux alternatives. La domination d'Nvidia est toujours solide, mais cette étape d'OpenAI est un signe que la carte des puissances des puces IA peut changer plus rapidement que les mises à jour d'applications sur les téléphones.