여러 상용 AI 모델에 대한 개인적인 평가
최근 AI 관련 연구가 지속되며 다양한 기업들이 AI 서비스를 제공하고 있어요.
Anthropic의 Claude, OpenAI의 ChatGPT, Google의 Gemini 가 대표적인 프론티어 AI 에요.
이를 제외하고도 Grok, Deepseek, EXAONE 등, 국내외 다양한 기업들이 AI 서비스를 제공하고 있기도 하지만, 개인적으로는 성능이나 보안 우려 측면에서 아직은 추천할만하지 못하다고 생각하여 이번 비교에서는 제외하려고 해요.
Anthropic - Claude
개인적으로는 가장 만족하면서 쓰고 있는 AI 서비스에요. 다른 AI 회사들과 달리, 답변을 생성하기 전에 이전 답변들을 전부 읽는 특징이 있어요. 이 때문에 대화가 길어져도 핵심 맥락을 유지한 채 답변하는 경향이 있어요. 다만 이 때문에 사용량을 빠르게 소모하므로 양보다는 질이 중요한 사람에게 추천해요. 제가 제대로 활용하고 있지는 않지만, 개발자 친구들이 유용하게 사용하고 있는 Claude Code 라는 강력한 코딩 도구도 이용할 수 있는데, 컴퓨터에 한번 설치만 해 두면 다양한 파일을 관리하고 프로젝트를 만드는 데 유용해요. 저는 대규모 데이터에서 특정 결과만 추출하기 위해 Claude Code에 간단한 자연어 명령만 입력했는데도 결과를 얻을 수 있어 연구에 큰 도움을 받았어요.
Haiku 4.5
Claude의 가장 하급 모델로, 빠른 응답과 낮은 비용이 장점인 모델이에요. 다른 회사의 하급 모델보다 상대적으로 똑똑한 면모를 보이는데, 아마도 Claude의 특징인 질문 다시 읽어오기 때문이 아닐까 생각이 듭니다. 일상 대화에는 괜찮지만, 본격적인 무언가(코딩이나 개념설계 등)를 하려고 하면 꽤나 답답한 모습을 보이기 때문에 간단한 대화나 정보 확인에만 쓰시는 것을 추천해요.
Sonnet 5
Claude의 중급 모델로, 대부분의 상황에서 만능인 모델이에요. 일상 대화부터 검색, 코딩이나 설계까지 못하는게 없습니다. 어렵지 않은 대부분의 작업에서 충분한 성능을 보이기는 하는데, 작업의 난이도가 올라갈수록 질문을 체계적으로 하지 않으면 원하는 결과를 내기에 조금 힘들어지니 주의해야 해요. Pro 요금제에서는 생각보다 사용량 한계가 빨리 찾아오니 이 모델부터는 전략적으로 질문을 압축하는 것이 중요하다고 생각해요.
Opus 4.8
Claude의 고급 모델로, 현존 AI 모델 중 가장 고성능의 모델 중 하나에요. 일상 대화나 검색에 쓰기에는 낭비이고, 정말 중요하다고 생각하시는 일에 선택적으로 투입하시는 것을 추천드려요. 체계적으로 질문하지 않아도 이전 대화가 쌓여있다면 거의 원하는 결과를 단번에 생성하는 강력한 모습을 보여요. 다만 Opus를 사용 시 Pro 요금제에서는 3~4번만의 질문으로도 사용량 한도에 거의 근접해버리기 때문에 제한적으로 사용할 필요가 있어요. 개인적으로는 어떤 프로젝트의 시작 시 Opus를 이용해 제대로 설계한 뒤, Sonnet을 이용해서 중간 결과물을 만들어내는 것을 추천드려요. 여기서 생기는 자잘한 버그는 현장에서 고치지 않고 기억만 해둔 뒤, 자기 전에 Opus에게 모두 설명하면 알아서 다 고쳐주거든요. 즉, 시작과 끝에 채용하면 좋아요.
Fable 5
Claude의 최상급 모델이에요. 현존 모델 중 가장 강력한 모델이라고는 하는데.. 이 시점에는 출시된 지 얼마 되지 않아서 개인적인 사용기를 쓰기에는 어렵네요. 아직까지는 Opus랑 큰 차이는 못 느끼고 있어요.
OpenAI - ChatGPT
많은 분들이 그렇듯, 저도 ChatGPT로 AI를 처음 만나게 되었고 지금까지도 유용하게 쓰고 있어요. Claude 대비 성능은 크게 뒤떨어지지 않으면서도 가격이 싸서 대규모 작업을 시키는 데 유리해요.
Google - Gemini
2025년 10월까지 진행했던 학생 1년 무료 플랜으로 써보기 시작했고, 일부 분야에서는 유용하게 쓰고 있어요. 하지만 타 AI 서비스에 비해 제 분야인 물리학에서는 꽤 답답한 대답을 내놓는 경우가 많아서 현재는 주력으로 채용하고 있지는 않아요. 가장 큰 장점이라면 역시 가성비인데, 가장 싼 요금제인 Plus만 가입하더라도 400GB에 달하는 엄청난 양의 클라우드 용량을 제공해줘요. 이 클라우드 용량은 Colab 사용 시 많은 데이터를 올려둘 수 있어서 굉장히 유용하게 느껴졌어요. 그리고 Gemini 모델을 사용한 Notebook LM 이라는 서비스가 있는데, 업로드한 자료만을 기반으로 답변을 제공해 환각 현상을 극도로 최소화한 서비스에요. 주로 논문이나 설명서 등을 업로드하고 문서 내용을 바탕으로 답변을 받을 때 유용하게 사용했어요.