구글의 TurboQuant, RAM 요구량을 최대 6x까지 줄일 수 있습니다.

구글은 글로벌 기술 산업의 풍경을 변화시킬 수 있는 인공 지능 분야에서 새로운 획기적인 발전을 발표했습니다. TurboQuant라는 압축 알고리즘을 통해 기술 거물은 AI 모델의 메모리 (RAM) 요구 사항을 최대 6 배 줄일 수 있다고 주장합니다.

이 혁신은 ChatGPT 및 Gemini와 같은 대규모 언어 모델의 빠른 발전으로 인해 RAM 요구 사항이 급격히 증가함에 따라 발생했습니다. 이전에는 고급 AI 모델이 매우 큰 메모리 용량을 필요로했기 때문에 글로벌 메모리 칩 가격이 상승하고 데이터 센터에서 소비자 노트북에 이르기까지 다양한 부문에서 병목 현상이 발생했습니다.

TurboQuant : 6x 더 많은 것을 넣을 수있는 "디지털 택시"

TurboQuant 기술은 정량화라고 불리는 방법으로 작동하며, 정확성을 크게 희생하지 않고 데이터를 단순화합니다. 주요 목표 중 하나는 AI에서 중요한 구성 요소 인 "키-값 캐시"로, 모델이 처음부터 다시 계산할 필요가 없도록 대화의 맥락을 저장합니다. 그러나 그것은 RAM을 매우 소비하는 것으로 알려져 있습니다.

이 새로운 접근 방식을 통해 Google은 달성 된 효율성이 최대 이론적 한계에 가깝다고 주장합니다. 간단한 비유: 무게를 더하지 않고 옷을 6 배 더 많이 넣는 것과 같습니다. 공간을 절약하지만 여전히 ​​기능적입니다.

이 발표는 시장을 즉각적으로 뒤흔들었습니다. 삼성전자, SK하이닉스, 마이크론테크놀로지와 같은 주요 칩 제조업체의 주식은 이 기술이 널리 채택되면 RAM 수요가 급격히 감소할 수 있다는 투자자의 우려에 따라 약화되었습니다.

그럼에도 불구하고 많은 분석가들은 글로벌 RAM 위기가 실제로 끝나지 않았다고 생각합니다. 효율성이 향상되면 더 복잡하고 "자원 욕구"가 높은 AI 개발을 유발하여 장기적으로 메모리 요구가 높을 수 있습니다.

현재 TurboQuant는 여전히 ​​연구 단계에 있으며 대량 사용에 대한 준비가되지 않았습니다. 대규모 구현은 많은 시간이 걸릴 것으로 예상되며, 특히 대기업이 이미 칩 공급 계약을 체결했습니다.

하지만 한 가지는 분명합니다. AI 효율성이 소프트웨어를 통해 극적으로 향상된다면 전 세계 RAM 공급에 대한 압력은 예상보다 빨리 완화 될 수 있습니다. AI 세계는 아직 효율적이지 않을 수도 있지만 적어도 "보다 효율적으로 살아가는 법"을 배우기 시작했습니다.

VOI 왓츠앱 채널을 따르십시오