// HOMELAB · 2026.06.29
48GB의 벽 — 듀얼 RTX 3090을 NVLink로 묶다
Qwen3 72B를 로컬에서 안정적으로 돌리려면 VRAM이 문제가 됩니다. 단일 RTX 3090은 24GB — Q4_K_M 양자화로도 72B 모델은 담기지 않습니다.
왜 NVLink인가
두 장의 3090을 PCIe만으로 연결하면 GPU 간 통신이 병목이 됩니다. NVLink 브리지를 쓰면 두 카드가 사실상 48GB의 통합 메모리 풀처럼 동작합니다.
전력 계산은 다음과 같이 잡았습니다:
(이어서 실측 토큰/초 비교, 발열 테스트 결과가 들어갈 자리입니다.)