// HOMELAB · 2026.06.29

48GB의 벽 — 듀얼 RTX 3090을 NVLink로 묶다

READ · 12 MIN

Qwen3 72B를 로컬에서 안정적으로 돌리려면 VRAM이 문제가 됩니다. 단일 RTX 3090은 24GB — Q4_K_M 양자화로도 72B 모델은 담기지 않습니다.

왜 NVLink인가

두 장의 3090을 PCIe만으로 연결하면 GPU 간 통신이 병목이 됩니다. NVLink 브리지를 쓰면 두 카드가 사실상 48GB의 통합 메모리 풀처럼 동작합니다.

전력 계산은 다음과 같이 잡았습니다:

Ptotal=Pgpu1+Pgpu2+Poverhead350W×2+80W=780WP_{total} = P_{gpu1} + P_{gpu2} + P_{overhead} \approx 350\text{W} \times 2 + 80\text{W} = 780\text{W}

(이어서 실측 토큰/초 비교, 발열 테스트 결과가 들어갈 자리입니다.)