구글, 차세대 AI 추론 모델 ‘제미니 2.5’ 공개

구글, 차세대 AI 추론 모델 ‘제미니 2.5’ 공개

구글, 차세대 AI 추론 모델 ‘제미니 2.5’ 공개… “답하기 전 먼저 생각합니다”

구글은 화요일, 질문에 답하기 전 잠시 ‘생각’을 거치는 차세대 AI 추론 모델 제품군 ‘제미니 2.5(Gemini 2.5)’를 공개했습니다.

이 새로운 모델군의 시작으로 구글은 **제미니 2.5 프로 실험 버전(Gemini 2.5 Pro Experimental)**을 출시했으며, 이는 멀티모달 기능과 고도화된 추론 능력을 갖춘 모델로, 지금까지 구글이 개발한 AI 중 가장 지능적이라는 평가를 받고 있습니다. 이 모델은 구글 AI 스튜디오(Google AI Studio) 및 월 $20 요금제인 제미니 어드밴스드(Gemini Advanced) 구독자를 위한 제미니 앱에서 이용할 수 있습니다.

구글은 앞으로 출시될 모든 신규 AI 모델에 추론 능력을 기본 탑재할 계획이라고 밝혔습니다.


AI 추론 경쟁 본격화… 구글, OpenAI 추격 가속

지난 2024년 9월, OpenAI가 세계 최초의 AI 추론 모델인 **“o1”**을 출시한 이후, 기술 업계는 이 모델의 성능을 따라잡거나 넘어서기 위한 경쟁에 돌입했습니다. 현재는 Anthropic, DeepSeek, 구글, 그리고 일론 머스크의 xAI까지 다양한 기업들이 추론 기반 AI 모델을 개발해 시장에 선보이고 있습니다.

이러한 추론 모델은 일반 AI보다 더 많은 연산 시간과 자원을 활용해 문제를 분석하고, 사실 검증과 논리적 추론을 수행한 뒤 응답을 생성합니다. 특히 수학 문제 풀이, 코딩 작업에서 뛰어난 성능을 보이며, 향후 인간 개입 없이 작업을 수행하는 자율형 AI 에이전트의 핵심 구성 요소로 주목받고 있습니다. 다만, 높은 성능만큼 운영 비용도 더 비싼 것이 단점입니다.


“가장 진보된 제미니”… 주요 평가에서 경쟁 모델 능가

구글은 이미 작년 12월, ‘생각하는 버전’의 제미니 모델을 선보인 바 있지만, 이번 제미니 2.5는 OpenAI의 ‘o 시리즈’를 정조준한 가장 본격적인 대응 모델로 평가받고 있습니다.

구글에 따르면 제미니 2.5 프로는 이전 최첨단 모델보다 뛰어난 성능을 보일 뿐 아니라, 일부 주요 경쟁 모델들도 앞선다고 주장합니다. 특히 시각적으로 매력적인 웹 애플리케이션 개발AI 에이전트형 코딩 분야에서 두각을 나타낸다고 설명했습니다.

  • 코드 편집 성능 평가(Aider Polyglot):
    제미니 2.5 프로는 **68.6%**를 기록하며, OpenAI, Anthropic, 중국 DeepSeek의 상위 모델들을 능가했습니다.
  • 소프트웨어 개발 능력 평가(SWE-bench Verified):
    **63.8%**를 기록해 OpenAI의 o3-mini, DeepSeek의 R1보다 우수하지만, **Anthropic의 Claude 3.7 Sonnet(70.3%)**보다는 낮은 점수를 받았습니다.
  • Humanity’s Last Exam(수천 개의 수학, 인문, 자연과학 문제 포함):
    제미니 2.5 프로는 **18.8%**로 다수의 경쟁 모델을 앞서는 성능을 보였습니다.

최대 200만 토큰 입력 예정… “반지의 제왕 전체보다 많다”

출시 초기에 제미니 2.5 프로는 100만 토큰 입력 창을 지원하며, 이는 약 75만 단어에 해당합니다. 이는 ‘반지의 제왕’ 전체 분량보다 긴 텍스트를 한 번에 입력받을 수 있다는 의미입니다. 향후에는 200만 토큰(150만 단어 이상)까지 지원할 예정입니다.

한편, Gemini 2.5 Pro의 API 가격은 아직 공개되지 않았으며, 구글은 몇 주 내로 더 많은 정보를 제공할 예정이라고 밝혔습니다.