투자 카테고리1/투자 [HouseVIEW]

미래에셋 2026.03 구글 TurboQuant 쇼크: 제본스는 멘탈이 완전히 나가버렸습니다

자본추적자 2026. 3. 31. 06:00


미래에셋 2026.03 구글 TurboQuant 쇼크: 제본스는 멘탈이 완전히 나가버렸습니다

 

매수매도 추천은 아니며 기관의 투자논리를 엿보기 위해 기록을 남깁니다.


미래에셋 구글 TurboQuant 쇼크: 제본스는 멘탈이 완전히 나가버렸습니다, 한종목, 2026-03-27

메모리 슈퍼사이클의 끝이 아니다. 추론 인프라가 더 가속할 것이다.

TurboQuant의 등장은 시장에 다시 한번 익숙한 공포를 불러왔습니다. KV 캐시를 16비트에서 3~4비트 수준까지 압축할 수 있다면, 결국 AI가 필요로 하는 메모리 총량도 줄어들 것이고, 그렇다면 HBM과 서버 DRAM, 기업용 SSD를 둘러싼 낙관도 꺾여야 한다는 해석입니다. 실제로 이런 종류의 알고리즘 발표는 메모리 반도체 주가의 단기 센티멘트를 흔들기에 충분합니다. 그러나 논문의 원본은 약 1년 전인 2025년 4월에 이미 공개되었고, 핵심 기초 연구자는 그보다 2년 전에 구글을 떠났습니다. 시장이 "뉴스"라고 부른 것은, 뉴스가 아니었습니다.

TurboQuant는 수학적으로 우아한 압축 기법입니다. 무작위 회전으로 데이터 분포를 균일화하고(PolarQuant), 극좌표 변환으로 보정 상수를 제거한 뒤, 1비트 잔차 처리(QJL)로 편향을 상쇄합니다. 3.5비트에서 16비트 원본과 정확히 동일한 성능(LongBench 기준)을 달성했으며, H100 GPU에서 최대 8배의 속도 향상을 이뤄냈습니다. 엣지 디바이스에서의 배포 장벽을 허문 것은 사실입니다.

그러나 프로덕션 환경은 이미 FP8/FP4로 돌아가고 있어, 실질적 추가 이득은 6배가 아니라 약 2.7배에 불과합니다. DeepSeek MLA의 28배 압축이 이미 존재하고, 추론 시 양자화는 업계에서 "이미 해결된 문제"로 분류됩니다. TurboQuant는 점진적 개선이지, “제로-투-원”이 아닙니다.

효율화가 수요를 줄인 적이 있습니까? 단 한 번도 없습니다. 2026년 3월 바로 지금, 제본스 역설의 가장 생생한 증거가 동시다발적으로 벌어지고 있습니다.

Anthropic의 Claude는 주간 30% 성장하며 세션 리밋을 조이고 있고, OpenAI는 Sora에 태우던 연 $54억의 GPU를 Codex로 재배치하면서 AI 비디오 생성 시장을 xAI의 Grok에게 내줬습니다. 효율화 기술이 이미 존재하는데도 컴퓨팅 수요가 공급을 초과하고 있다는, 2026년 3월 시점의 가장 직접적인 증거입니다. 만약 TurboQuant가 정말로 비용을 낮추면, 샘 알트만은 Sora를 다시 부활시킬 것입니다. 이는 지금 이 순간에도 컴퓨팅이 남아도는 것이 아니라 여전히 절대적으로 부족하다는 현실을 보여줍니다. 효율화는 축소가 아니라, 과거에 비용 때문에 포기했던 워크로드를 다시 부활시키는 연료입니다.

결론적으로 이번 TurboQuant 이슈는 메모리 슈퍼사이클의 종말 신호라기보다, 추론 인프라가 다음 단계로 넘어가기 위한 비용 구조 개선의 신호로 해석하는 편이 타당합니다. 중장기적으로 보면, AI 인프라의 물리적 토대를 공급하는 HBM과 고용량 DRAM, 기업용 스토리지의 전략적 가치는 오히려 더 선명해질 가능성이 높습니다.

10년간 AI 추론 인프라를 구축하며 모든 양자화를 써본 AI 베테랑 개발자들의 중론은, "메모리는 여전히, 그리고 앞으로도 병목입니다." 제본스의 역설은 산업의 당사자가 인정하고, 주가가 증명했었던 구조적 현실입니다.