Sector Analysis

2025 H100/H200·B200 대응 글로벌 AI 서버 수급전: ODM 구조 변화와 리드타임 전망

ORISEN 2025. 11. 12. 11:13

1️⃣ GPU 경쟁의 본질은 이제 “공급망 관리력”입니다

2025년 글로벌 AI 서버 시장은 전례 없는 공급 불균형을 맞이하고 있습니다.
NVIDIA의 H100/H200, AMD의 MI300 시리즈, 그리고 2026년 상용화가 예상되는 B200(Blackwell) 의 수요 급증으로 인해
ODM(Original Design Manufacturer) 구조가 근본적으로 재편되고 있습니다.

GPU는 더 이상 단일 부품이 아니라,
**“공급 제한형 인프라 자산”**으로 취급됩니다.
특히 H100의 리드타임은 2024년 6개월 수준에서 2025년 초 7~8개월로 연장되었으며,
AI 데이터센터 구축 속도가 반도체 공급 속도에 종속되는 구조가 형성되었습니다.


2️⃣ 글로벌 AI 서버 공급 구조: 5개 ODM이 시장을 지배합니다

구분주요 ODM점유율(2025E)주요 고객특징
Wiwynn 대만 28% Meta, Microsoft AI 서버 조립·통합 중심
Quanta Cloud 대만 22% AWS, Google 대형 GPU 클러스터 대응
Inventec 대만 17% NVIDIA, Oracle CoWoS 패키지 서버 주력
Foxconn (Hon Hai) 대만 14% Apple, Tesla GPU·AI 칩 외주 제조
MiTAC / Supermicro 대만·미국 10% AI 스타트업 중심 유연한 커스터마이징 강점

ODM 5개사가 글로벌 AI 서버의 90% 이상을 담당하고 있으며,
생산은 주로 대만·중국·말레이시아에서 이뤄지고 있습니다.

그러나 GPU 납품 일정의 변동성 때문에
서버 제조 리드타임이 4~7개월까지 늘어나면서
글로벌 클라우드 기업들의 AI 인프라 확장 계획이 지연되고 있습니다.


3️⃣ 리드타임 지연의 근본 원인

🔹 (1) GPU Allocation

NVIDIA는 주요 Hyperscaler(구글, 메타, 아마존, 마이크로소프트)에 GPU를 분기 단위로 배분하고 있습니다.
이 때문에 중소 클라우드나 AI 스타트업은 **“잔여 할당분 시장(secondary allocation)”**을 통해 GPU를 확보합니다.
이 시장에서 H100의 프리미엄은 **공식가 대비 +30~40%**까지 형성되어 있습니다.

🔹 (2) 패키징·전력 모듈 병목

AI 서버는 고성능 GPU 8~16개가 병렬 연결된 구조를 갖습니다.
이를 위한 전력공급 모듈(PSU)과 CoWoS 패키징 수율의 한계가
실제 생산량의 병목으로 작용하고 있습니다.

🔹 (3) 물류·검증 리드타임 증가

AI 서버는 출하 후에도 펌웨어·전력 효율 검증이 필수이므로
납품까지의 총 리드타임이 평균 28~32주로 늘어나 있습니다.


4️⃣ Hyperscaler CAPEX와 조달 전략

기업2024 CAPEX (억 달러)2025EAI 비중조달 전략
Microsoft 480 520 64% NVIDIA 직접 계약 + ODM 3사 병행
Google 410 470 61% TPU + NVIDIA 병행, ODM 분산
Amazon (AWS) 380 430 58% 자체 Inferentia·Trainium 혼합
Meta 360 400 67% Wiwynn 중심 통합 계약
Oracle 160 190 72% Inventec 전용 계약 구조

대형 클라우드 기업들은 GPU 직계약 + ODM 분산 생산의 투트랙 전략을 쓰고 있습니다.
이는 공급 위험을 최소화하는 동시에 전력 효율·냉각 효율 최적화 설계를 가능하게 합니다.


5️⃣ 2025~2027년 AI 서버 출하량 전망

구분20242025E2026ECAGR(’24~’26)
글로벌 AI 서버 출하량 1.2M대 2.0M대 3.4M대 +65.4%
NVIDIA GPU 탑재 서버 비중 82% 78% 72% -10pp
AMD GPU 탑재 서버 비중 14% 18% 22% +8pp
ASIC/NPU 기반 서버 비중 4% 4% 6% 완만한 상승

AI 서버 시장은 향후 3년간 연평균 +60% 이상 성장이 예상되지만,
이는 공급망 효율화와 리드타임 단축이 병행될 때만 가능할 것입니다.


6️⃣ ORISEN 인사이트 — “GPU의 시대는, 공급망의 시대입니다.”

📍 2025년 AI 서버 시장의 경쟁력은 GPU 성능이 아니라 조달 속도에 달려 있습니다.
📍 NVIDIA의 공급 배분 구조와 CoWoS 패키징 캐파가 글로벌 생산의 병목을 결정합니다.
📍 Hyperscaler 기업들은 GPU 중심에서 전력 효율·조달 안정성 중심의 설계 전략으로 이동하고 있습니다.

결론:
AI 인프라의 확장은 더 이상 단순한 기술의 문제가 아닙니다.
“누가 먼저, 안정적으로 GPU를 확보하느냐”,
그것이 2025년 AI 시장의 새로운 경쟁 축입니다.
— ORISEN | Sector Analysis