엔비디아의 H100은 정답이 아니다: AI 비용의 90%를 차지하는 ‘추론(Inference)’의 경제학
AI 모델을 만드는 ‘학습’보다 실시간으로 구동하는 ‘추론’ 비용이 기하급수적으로 증가하고 있습니다. 엔비디아의 독주를 위협하는 LPU(Groq)와 NPU 기술, 그리고 효율성(Efficiency) 중심으로 재편되는 반도체 시장의 흐름
AI 모델을 만드는 ‘학습’보다 실시간으로 구동하는 ‘추론’ 비용이 기하급수적으로 증가하고 있습니다. 엔비디아의 독주를 위협하는 LPU(Groq)와 NPU 기술, 그리고 효율성(Efficiency) 중심으로 재편되는 반도체 시장의 흐름
AI 시대의 원유는 데이터가 아니라 반도체입니다. 메모리 병목을 해결할 HBM의 기술적 핵심과, 엔비디아의 GPU 아성에 도전하는 차세대 NPU 시장을 분석합니다.
현재 인류가 사용하는 컴퓨터의 99%는 1945년에 제안된 ‘폰 노이만(Von Neumann) 구조’를 기반으로 한다. CPU(연산)와 메모리(저장)가 분리되어 있고, 이 둘 사이를 버스(Bus)라는 통로로 데이터가 오가는 방식이다. 이 구조는 지난 70년간 컴퓨팅 혁명을 이끌었지만, 인공지능(AI) 시대에 접어들며 치명적인 한계에 봉착했다. AI 연산은 방대한 데이터를 동시다발적으로 처리해야 하는데, CPU와 메모리 사이의 통로가 좁아 데이터 이동에 병목 현상(Bottleneck)이 발생하고 … 더 읽기
대중에게 “반도체 강국 대한민국”이라는 수식어는 익숙하다. 하지만 엔지니어링 관점에서 이 문장은 반쪽짜리 진실에 가깝다. 한국이 지배하는 시장은 데이터를 저장하는 ‘메모리(Memory)’ 분야일 뿐, 연산과 제어를 담당하는 ‘시스템(System)’ 반도체 시장에서는 여전히 추격자의 위치에 있기 때문이다. 반도체라는 하나의 이름으로 묶여 있지만, 이 두 분야는 설계 철학부터 제조 공정, 수익 구조까지 완전히 다른 문법을 가진다. 이번 리포트에서는 두 반도체의 … 더 읽기
1965년, 인텔의 공동 창업자 고든 무어(Gordon Moore)는 “반도체 집적회로의 성능은 24개월마다 2배로 증가한다”는 경험칙을 제시했다. 이른바 ‘무어의 법칙(Moore’s Law)’이다. 지난 반세기 동안 이 법칙은 IT 산업을 지탱하는 절대적인 진리이자, 엔지니어들이 반드시 달성해야 하는 마일스톤(Milestone)이었다. 하지만 현재, 반도체 산업은 물리적 한계라는 거대한 장벽 앞에 서 있다. 회로 선폭이 나노미터(nm) 단위를 넘어 원자 단위인 옹스트롬(Å) 시대로 진입하면서, … 더 읽기