TurboQuant de Google peut maintenant réduire les besoins en RAM jusqu'à 6x
JAKARTA — Google a introduit une nouvelle innovation dans le domaine de l’intelligence artificielle qui pourrait transformer le paysage de l’industrie technologique mondiale. Par l’intermédiaire d’un algorithme de compression appelé TurboQuant, le géant de la technologie affirme être capable de réduire de six fois la mémoire (RAM) nécessaire aux modèles d’IA.
Cette innovation arrive alors que la demande de RAM a explosé en raison de l'essor des modèles de langage de grande taille tels que ChatGPT et Gemini. Jusqu'à présent, les modèles IA sophistiqués nécessitent une capacité de mémoire très grande, provoquant une hausse des prix des puces de mémoire mondiales et créant un goulot d'étranglement dans divers secteurs, des centres de données aux ordinateurs portables de consommation.
TurboQuant: « Digital Wallet » qui peut contenir 6 fois plus
La technologie TurboQuant fonctionne avec une méthode appelée quantification, qui simplifie les données sans sacrifier l’exactitude de manière significative. L’un de ses principaux objectifs est le « cache de valeurs clés », un composant essentiel de l’IA qui stocke le contexte de la conversation afin que le modèle n’ait pas à recalculer à partir de zéro, mais il est connu pour être très gourmand en RAM.
Avec cette nouvelle approche, Google affirme que l'efficience atteinte est proche de la limite théorique maximale. Une analogie simple: c'est comme mettre six fois plus de vêtements dans un sac sans ajouter de poids - économiser de l'espace, mais rester fonctionnel.
Cette annonce a bouleversé le marché. Les actions des grands fabricants de puces telles que Samsung Electronics, SK Hynix et Micron Technology ont baissé, car les investisseurs craignaient que la demande de RAM ne diminue drastiquement si cette technologie était largement adoptée.
Cela dit, de nombreux analystes estiment que la crise mondiale de la RAM n’est pas vraiment terminée. L’élévation de l’efficacité pourrait en fait stimuler le développement d’IA plus complexe et « ravageur de ressources », de sorte que la demande de mémoire reste élevée à long terme.
Pour le moment, TurboQuant est encore dans la phase de recherche et n’est pas prêt pour une utilisation massive. L’implémentation à grande échelle devrait prendre du temps, surtout que de nombreux contrats d’approvisionnement en puces ont été conclus par de grandes entreprises technologiques.
Une chose est claire, cependant : si l’efficience de l’IA peut être drastiquement améliorée par le biais du logiciel, la pression sur l’offre mondiale de RAM pourrait s’atténuer plus rapidement que prévu. Le monde de l’IA peut ne pas être économe, mais il commence tout au moins à apprendre à « vivre plus efficacement ».
Suivez la chaîne Whatsapp VOI