xAI, 세계에서 가장 똑똑한 AI '그록-3' 공개 – GPT-4o 능가할까?
최근 일론 머스크가 이끄는 xAI가 최신 프론티어 인공지능(AI) 모델 '그록-3(Grok-3)' 제품군을 발표했다. 이 모델은 세계 최대 규모의 AI 데이터센터 '콜로서스(Colossus)'에서 훈련되었으며, 각종 벤치마크에서 오픈AI의 'GPT-4o'를 능가하는 성능을 보여 주목받고 있다.
이번 발표에서 xAI는 AI 추론 모델 '그록-3 추론(Reasoning)', 그리고 오픈AI의 '딥 리서치(Deep Research)'와 유사한 '딥서치(DeepSearch)'라는 추론 에이전트도 공개하며 AI 업계의 패러다임을 바꾸려는 의지를 보였다. 과연 그록-3는 현재 가장 강력한 AI 모델이 될 수 있을까?
🔍 그록-3: 4가지 버전으로 출시
그록-3는 단순한 AI 모델이 아니다. 멀티모달 모델(LMM)로 텍스트뿐만 아니라 이미지까지 처리할 수 있는 능력을 갖추고 있다. 이번에 출시된 버전은 총 4가지로 구성된다:
- 그록-3 미니 – 경량화된 버전으로, 모바일 환경에서도 원활하게 작동.
- 그록-3 – 표준 버전으로, 텍스트와 이미지 처리 가능.
- 그록-3 추론(Reasoning) – 복잡한 질의를 해결하기 위한 '빅 브레인(Big Brain)' 모드를 제공.
- 그록-3 미니 추론 – 미니 모델에서도 고급 추론 기능을 제공.
특히 그록-3 추론 모델은 추가 컴퓨팅을 사용해 더 깊은 분석과 추론이 가능하도록 설계됐다. 이는 AI의 한계를 뛰어넘는 **'생각하는 AI'**의 가능성을 시사한다.
🔎 💡 '딥서치'란? – 인터넷 검색을 대신하는 AI
xAI는 이번 발표에서 오픈AI의 '딥 리서치'와 비슷한 기능을 가진 '딥서치(DeepSearch)'도 공개했다.
이 기능은 인터넷을 대신 검색하고, 복잡한 정보를 종합하여 사용자가 원하는 답변을 제공하는 AI 시스템이다. 단순히 웹사이트를 긁어오는 것이 아니라, 고급 추론을 통해 사용자가 원하는 핵심 정보를 정리해 준다는 점에서 기존 검색 엔진과 차별화된다.
딥서치는 몇 주 안으로 그록-3와 함께 xAI의 기업용 API에 통합될 예정이다.
![]() |
그록-3 추론 벤치마크 결과 (사진=X, xAI) |
![]() |
그록-3 벤치마크 결과 (사진=X, xAI) |
🚀 벤치마크 테스트 – GPT-4o를 넘어섰다?
xAI는 이번 발표에서 그록-3의 성능이 GPT-4o를 능가한다는 점을 강조했다. 이를 뒷받침할 벤치마크 결과는 다음과 같다:
📊 AI 벤치마크 성능 비교
테스트 | 그록-3 | GPT-4o |
---|---|---|
AIME 2025 (수학 능력) | 52점 | 39점 |
GPQA (박사 수준 과학 지식) | 75점 | 65점 |
코딩 능력 테스트 | 57점 | 40점 |
가장 큰 차이를 보인 것은 수학 테스트(AIME 2025)에서 그록-3가 52점을 기록하며 GPT-4o(39점)를 크게 앞섰다는 점이다. 또한 과학과 코딩 테스트에서도 그록-3가 앞서는 결과를 보여주었다.
그러나 오픈AI가 바로 전날 발표한 GPT-4o 업데이트 버전과의 직접적인 비교는 이루어지지 않았다는 점에서 다소 보완이 필요하다.
특히, '그록-3 추론 모델'의 경우 AIME 2025에서 93점을 기록, 오픈AI의 최신 모델을 넘어서며 현존하는 최고의 AI 추론 모델임을 입증했다.
![]() |
grok-3-IM아레나 리더보드 |
💰 가격과 서비스 – 슈퍼그록(SuperGrok) 등장
그록-3와 그록-3 미니는 X(트위터)에서 제공되는 '프리미엄+' 요금제(월 22달러)에서 사용할 수 있다. 그러나 더 강력한 기능을 원할 경우, 새로운 '슈퍼그록(SuperGrok)' 요금제(월 30달러)가 필요하다.
✅ 슈퍼그록 요금제 특징:
-
추론 모델 및 딥서치 사용 가능
-
무제한 이미지 생성 제공
-
추가 컴퓨팅을 활용한 더 깊은 분석 가능
이 요금제는 xAI가 AI 모델을 서비스화하여 직접적인 수익을 창출하는 전략을 보여준다.
🏭 그록-3, 어디서 훈련되었나? – 콜로서스 데이터센터
그록-3는 미국 멤피스의 '콜로서스(Colossus)' 데이터센터에서 훈련되었다. 머스크는 이곳이 세계 최대 규모의 AI 데이터센터라고 강조했으며, 모델이 10개 이상의 GPU를 사용하여 훈련되었다고 밝혔다.
이 때문에 머스크는 그록-3가 그록-2보다 훨씬 유능할 것이라고 예고했고, 실제로 발표된 벤치마크에서도 이 점을 입증했다.
🎤 그록-3의 미래 – AI 음성 비서 기능 추가
머스크는 이번 행사에서 그록-3가 곧 AI 음성 비서 기능을 갖출 것이라고 밝혔다.
🔜 앞으로 1주일 안에 그록 앱에 음성 모드가 추가될 예정이다.
또한, 그록-1과 그록-2를 오픈 소스로 공개할 계획도 발표했다. 머스크는 "우리는 일반적으로 다음 버전이 완전히 출시되면, 이전 버전을 오픈 소스로 공개한다"라며 AI의 투명성을 강조했다.
🔥 그록-3 vs GPT-4o – AI 최강자는 누구인가?
현시점에서 그록-3는 AI 벤치마크에서 GPT-4o보다 뛰어난 성능을 보이며 '세계에서 가장 똑똑한 AI'라는 타이틀을 얻었다. 하지만:
✅ 오픈AI의 GPT-4o 최신 업데이트와의 직접 비교는 이루어지지 않았다 ✅ HLE(인류의 마지막 시험) 벤치마크 결과는 공개되지 않았다 ✅ API 사용료 및 세부 가격 정책이 아직 명확하지 않다
그록-3는 AI 시장에서 강력한 도전자로 떠오르고 있지만, 여전히 오픈AI와 구글(제미나이) 등과의 경쟁이 지속될 것으로 보인다.
과연 AI 최강자의 자리를 누가 차지할 것인가? 앞으로의 전개가 더욱 기대된다. 🚀
댓글 쓰기