/01
48GB의 벽 — 듀얼 RTX 3090을 NVLink로 묶다
Qwen3 72B를 Q4_K_M으로 로컬에서 돌리기 위한 VRAM 확보기. 3-슬롯 브리지 선정부터 전력·발열 한계, 그리고 단일 카드 대비 실측 토큰/초까지.
Xeoni가 여러 AI 모델을 사용해보며 내린 개인적인 평가, 2026년 7월 기준으로 작성됨. Claude - 가장 인간적인 대답을 내놓으며, 맥락 이해에 강점을 가짐. 일반적인 사용에서는 가장 강력하나 제공량이 적은게 큰 단점. ChatGPT - Claude 만큼 뛰어난 성능을 가지고 있으며, 제공량도 많음. 그러나 대화가 길어질 경우 맥락을 가장 빨리 잃어버림. Gemini - 가장 가성비 좋은 플랜을 제공함. AI 서비스 결제 시 클라우드 사용량 제공, 그러나 3사 중 고급 추론 성능이 가장 떨어짐. 결론 - AI 사용량이 많지 않다면 Claude, 사용량이 많은 편이라면 ChatGPT. 코딩이나 연구 등 고급 작업은 Claude 상위 모델 추천.
Qwen3 72B를 Q4_K_M으로 로컬에서 돌리기 위한 VRAM 확보기. 3-슬롯 브리지 선정부터 전력·발열 한계, 그리고 단일 카드 대비 실측 토큰/초까지.