TurboQuant de Google peut maintenant réduire les besoins en RAM jusqu'à 6x

JAKARTA — Google a introduit une nouvelle innovation dans le domaine de l’intelligence artificielle qui pourrait transformer le paysage de l’industrie technologique mondiale. Par l’intermédiaire d’un algorithme de compression appelé TurboQuant, le géant de la technologie affirme être capable de réduire de six fois la mémoire (RAM) nécessaire aux modèles d’IA.

Cette innovation arrive alors que la demande de RAM a explosé en raison de l'essor des modèles de langage de grande taille tels que ChatGPT et Gemini. Jusqu'à présent, les modèles IA sophistiqués nécessitent une capacité de mémoire très grande, provoquant une hausse des prix des puces de mémoire mondiales et créant un goulot d'étranglement dans divers secteurs, des centres de données aux ordinateurs portables de consommation.

TurboQuant: « Digital Wallet » qui peut contenir 6 fois plus

La technologie TurboQuant fonctionne avec une méthode appelée quantification, qui simplifie les données sans sacrifier l’exactitude de manière significative. L’un de ses principaux objectifs est le « cache de valeurs clés », un composant essentiel de l’IA qui stocke le contexte de la conversation afin que le modèle n’ait pas à recalculer à partir de zéro, mais il est connu pour être très gourmand en RAM.

Avec cette nouvelle approche, Google affirme que l'efficience atteinte est proche de la limite théorique maximale. Une analogie simple: c'est comme mettre six fois plus de vêtements dans un sac sans ajouter de poids - économiser de l'espace, mais rester fonctionnel.

Cette annonce a bouleversé le marché. Les actions des grands fabricants de puces telles que Samsung Electronics, SK Hynix et Micron Technology ont baissé, car les investisseurs craignaient que la demande de RAM ne diminue drastiquement si cette technologie était largement adoptée.

Cela dit, de nombreux analystes estiment que la crise mondiale de la RAM n’est pas vraiment terminée. L’élévation de l’efficacité pourrait en fait stimuler le développement d’IA plus complexe et « ravageur de ressources », de sorte que la demande de mémoire reste élevée à long terme.

Pour le moment, TurboQuant est encore dans la phase de recherche et n’est pas prêt pour une utilisation massive. L’implémentation à grande échelle devrait prendre du temps, surtout que de nombreux contrats d’approvisionnement en puces ont été conclus par de grandes entreprises technologiques.

Une chose est claire, cependant : si l’efficience de l’IA peut être drastiquement améliorée par le biais du logiciel, la pression sur l’offre mondiale de RAM pourrait s’atténuer plus rapidement que prévu. Le monde de l’IA peut ne pas être économe, mais il commence tout au moins à apprendre à « vivre plus efficacement ».

Suivez la chaîne Whatsapp VOI

Tag: google artificial intelligence algoritma

Nouvelles connexes :

Chronologie des affrontements à Menteng, commençant par un conflit dans un bar jusqu'à 1 mort

JSE lundi a la possibilite d'évaluer le niveau 6.000-6.100, observez les recommandations de ses actions

Les cas de violence et de harcèlement des enfants augmentent, le parlement de Bogor demande que la loi soit promulguée immédiatement

Jember Fashion Carnaval 2026 avec 2 500 participants, parade s'étend sur 3,6 kilomètres

Les incendies de forêt en Espagne commencent à être maîtrisés, 121 000 habitants sont toujours touchés

MilkLife Archery Challenge 2026 devient un baromètre de la formation des archers