“GPU만 보던 시장이 NPU·ASIC 구조까지 확장되는 이유”
(AI × Finance | ORISEN)
1️⃣ AI 투자 프레임이 바뀌는 핵심 이유: “비용 구조의 중심이 달라졌다”
2023~2025년 AI 인프라 투자 시장은 GPU 중심 구조였다.
그러나 2026~2028년은 기업들의 관점이 “성능 중심 → 비용·효율 중심”으로 이동하면서
투자 프레임 자체가 재정의된다.
AI 기업의 비용 구조는 다음처럼 재편되고 있다:
- 학습(Training) 비용 → 감소 또는 고정
- 추론(Inference) 비용 → 폭발적 증가
- 전력·냉각·옵틱스 비용 → TCO의 40~55% 차지
- 클러스터 구성 비용(Fabric 중심) → 핵심 경쟁력
즉, 투자자는 더 이상 GPU 성능 자체보다
**“어떤 아키텍처가 추론 비용을 얼마나 줄이는가”**를 봐야 하는 시대가 도래한다.
2️⃣ GPU 중심 생태계가 흔들리는 이유 (2026~2028)
✔ (1) LLM·MLLM 서비스화 → 추론 트래픽 폭발
- 일평균 요청량 증가
- 토큰 사용량 3~10배 증가
- 기업형 자동화 에이전트 도입
➡ GPU의 비용 효율은 Inference에서 제한적.
✔ (2) 전력 비용 급증 → 효율 중심 구조 강화
2028년 기준, AI 데이터센터의 총비용 중 50%가 전력·냉각·옵틱스에서 발생할 전망.
GPU는 고성능이지만 전력 효율이 떨어진다.
➡ 전력효율 중심의 ASIC·NPU가 구조적 우위 확보.
✔ (3) Fabric 병목이 GPU의 확장성을 제한
1.6T → 3.2T로 연결 속도가 증가해도
GPU 기반 클러스터는 Fabric 구조의 제약이 커짐.
➡ “GPU 성능이 좋아도, 클러스터가 효율적으로 돌아가지 않으면 의미가 없다.”
3️⃣ AI 가속기 투자에서 부상하는 세 가지 축
🔸 (1) ASIC/NPU 중심 Inference 가속기
- GPU 대비 비용 효율 4~10배
- 기업형 LLM 서비스에서 선호도 급증
- Hyperscaler 전용 설계 증가
투자 포인트:
TPU·Inferentia·Artemis 등 ASIC 생태계 + 패브릭·HBM 공급망
🔸 (2) 패브릭(Fabric) 인프라 기업
AI Inference는 네트워크 병목이 비용을 결정한다.
- 옵틱스
- 스위치
- 패브릭 관리 소프트웨어
- 고대역폭 연결(1.6T → 3.2T → 6.4T)
투자 포인트:
옵틱스 공급망, 데이터센터 네트워크 전문 기업
🔸 (3) 메모리·패키징 인프라
GPT-5급 모델 이후, GPU보다 HBM·패키징이 더 중요한 인프라가 된다.
- HBM4E 수요 급증
- CoWoS/2.5D 패키징 필요량 급증
- 메모리 대역폭이 AI 성능을 결정
투자 포인트:
HBM4E 공급사·패키징 장비 업체 지속 수혜
4️⃣ AI 기업이 실제로 선택하는 아키텍처 변화
🟦 미국 Big Tech
- Training: GPU 중심
- Inference: ASIC 중심
- 네트워크 최적화 우선순위 상승
🟥 중국
- Nvidia 규제 → NPU 생태계 급성장
- 2028년 로컬 추론 인프라의 60%가 NPU 기반 전망
🟧 유럽
- 에너지 비용 구조 → 저전력 ASIC 선호
🟩 아시아
- 한국/대만: HBM·패키징 중심 강세
- 일본: 전력효율 중심 ASIC 구조 빠르게 채택
5️⃣ ORISEN Insight
“AI 가속기 시장의 투자 판단 기준은 이제 ‘Compute 성능’이 아니라 ‘Inference 효율성’이다.”
📌 GPU 중심 구조는 계속 중요하지만 이미 한계 도달
📌 ASIC·NPU 기반의 Inference 최적화가 비용의 60%를 결정
📌 Fabric·옵틱스·전력 구조가 투자 판단의 핵심 지표
📌 HBM·패키징·네트워크가 구조적 수혜 산업
📌 국가별 인프라·전력·규제 리스크가 투자 방향성 변화 요인
결론:
AI 투자 전략은 더 이상 GPU만 보면 안 된다.
효율을 결정하는 NPU·ASIC·Fabric·HBM 구조까지 확장해야 한다.
— ORISEN | AI × Finance
'Ai x Finance' 카테고리의 다른 글
| AI 기반 시설 비용의 구조적 상승 (2026~2030) (0) | 2025.12.04 |
|---|---|
| 2027년 AI GPU 시장의 구조적 변화 (0) | 2025.12.03 |
| 학습이 아니라 추론(Inference)이 비용의 80%를 결정하는 시대 (0) | 2025.12.01 |
| 2026, AI 운영비용(OPEX)에 따른 경쟁 변화 (0) | 2025.11.30 |
| 2026 AI Server Architecture ShiftHBM4E · NPU · Accelerator 삼중 구조의 변화 (0) | 2025.11.27 |