Ai x Finance

AI 기반 시설 비용의 구조적 상승 (2026~2030)

ORISEN 2025. 12. 4. 15:39

“전력·냉각·옵틱스가 AI 비용의 40% 이상을 차지하는 시대”

 

1️⃣ 2026~2030년 AI 비용은 ‘컴퓨트’가 아니라 ‘인프라’가 끌어올린다

2023~2025년 AI 산업의 비용 논의는 GPU 가격·컴퓨트 용량 중심이었다.
그러나 2026년 이후, AI가 실질적인 서비스 트래픽 규모로 확장되면서
비용의 중심축은 컴퓨트에서 전력·냉각·옵틱스 인프라로 이동한다.

그 이유는 다음과 같다:

  • 학습(Training)보다 추론(Inference)이 전체 워크로드의 90% 이상
  • 추론은 “지속적 + 고빈도 + 지연(time-sensitive)”
  • GPU보다 전력·네트워크 자원이 병목으로 등장

2029년 기준 — AI 데이터센터에서 전력·냉각·옵틱스 비용이 TCO의 40~55%까지 상승한다.

이 변화는 모든 AI 기업의 단위경제(Unit Economics)를 재정의한다.


2️⃣ 전력(Power): 랙 전력이 30kW → 100kW 시대

AI 모델 크기 증가 + 멀티모달 트래픽 확대는 랙 전력 사용을 기하급수적으로 끌어올린다.

✔ 랙 전력 변화

  • 2024: 20~30kW
  • 2027: 60~80kW
  • 2029: 100kW 이상으로 진입

✔ 전력 비용이 증가하는 이유

  • 고대역폭 HBM4E/HBM4E+ 채용
  • 더 높은 패브릭 속도(1.6T → 3.2T)
  • ASIC·NPU 병렬화
  • 냉각 수요 폭발

➡ 전력 효율(PUE) 개선 여부가 비용 구조 경쟁력의 핵심으로 떠오른다.


3️⃣ 냉각(Cooling): 공랭 → 수랭 → 액침 쿨링으로 이동

AI 데이터센터의 온도 문제는 단순한 운영 문제가 아니라 경제성 문제다.

🔹 공랭(Air Cooling) 한계

고밀도 랙에서 공기 냉각은 거의 비효율 수준.

🔹 수랭(Direct Liquid Cooling) 비중 확대

  • 2027: 신규 HPC/AI 랙의 50% 이상이 수랭
  • 전력 효율성 +40%
  • 운영 비용 절감 효과 뚜렷

🔹 액침(Immersion) 쿨링 도입

2030년까지 Hyperscaler의 20~30% 자동 도입 예상

➡ 쿨링은 단순 비용이 아니라 AI Inference 비용의 필수 한계 조건이 된다.


4️⃣ 옵틱스(Optics): 소비전력의 ‘보이지 않는 주범’

AI Inference 트래픽은 네트워크 I/O의 폭발적 증가를 의미한다.
이에 따라 옵틱스 비용과 전력 소비 비중은 매년 상승한다.

✔ 왜 옵틱스가 핵심인가?

  • LLM/MLLM 추론은 GPU 간 통신이 Compute보다 더 많이 전력 소모
  • API 호출 증가로 데이터 전송량 4~7배 증가
  • 800G → 1.6T → 3.2T 전환은 전력 소비를 선형 이상으로 끌어올림

✔ 결과

2029년 AI 데이터센터 전력 중 20~30%가 옵틱스 소비전력에서 발생.

Hyperscaler에게 옵틱스는 더 이상 부차 자원이 아니다.
“옵틱스 효율 = 추론 비용 효율”이 된다.


5️⃣ Inference TCO는 어떻게 구성되는가 (2029 기준)

항목비중
GPU/Compute 35~45%
전력(Power) 25~30%
냉각(Cooling) 10~15%
옵틱스/네트워크 15~20%
기타 5%

즉, 컴퓨트보다 인프라 비용이 더 큰 시대가 온다.


6️⃣ 기업이 취해야 할 비용 최적화 전략

🔹 (1) GPU → ASIC/NPU 혼합 아키텍처

추론 중심 구조에서는 ASIC이 GPU 대비 비용 효율 4~10배

🔹 (2) Token Efficiency 전략

토큰 절약 = 비용 절감

  • Prompt 단축
  • Token pruning
  • Context 관리
  • 모델 압축/양자화

🔹 (3) Fabric 최적화

네트워크 병목 해소

  • 3.2T 전환
  • Optics 전력 절감 설계
  • 토폴로지 최적화

🔹 (4) Cooling Redesign

  • 액침/수랭 비중 확대
  • 냉각 효율 PUE 0.1 개선 → 비용 10~15% 절감

7️⃣ ORISEN Insight

“2026~2030년 AI의 비용 문제는 Compute가 아니라 인프라가 만든다.”

📌 GPU 성능 경쟁 → 인프라 효율 경쟁으로 구조 전환
📌 추론 비용의 40~55%가 전력·냉각·옵틱스에서 발생
📌 랙 전력 100kW 시대는 비용 최적화 전쟁의 개막
📌 Token Efficiency + ASIC 조합이 가장 효율적
📌 Hyperscaler는 Compute보다 Fabric/Power에 집중

결론:
AI 비용의 미래는 전력·냉각·옵틱스라는
세 가지 인프라 축을 얼마나 효율적으로 설계하느냐에 달려 있다.
— ORISEN | AI × Infrastructure