AI

[AI] xAI의 그록(Grok)3

H.Hoper 2025. 2. 25. 18:32

🎃 의미

  • chocolate (Early Grok-3): 공개이전에 챗봇아레나에서 사용한 이름
  • xAI에 개발중인 차세대 인텔리전스 AI 플랫폼
    • xAI의 목적: 우주의 본질을 이해하고자 하는 AI(진리 추구)
    • xAI 기업가치: 주당 95달러, 약 1조 1천억 기업 가치
    • 최근 14조 규모의 투자 유치 협상 중
  • 그록(Grok) = Heinlein의 공상과학소설 '낯선 땅의 이방인(Stranger in a Strange Land)'에서 유래된 "완전히 (깊이)이해하다"는 의미
  • 그록(Grok)3: 이해력, 문제 해결력, 문맥 인식을 향상시키기 위해 설계된 Grok 시리즈의 3세대 AI 모델
  • 모델: 베타 추론 모델인 Grok 3(Think)와 Grok 3 mini(Think) 발표
  •  

🎃 주요 학습

  • 트랜스포머 기반 신경망(연쇄 사고 프로세스(CoT))과 고급 강화 학습
  • 컨텍스트 쿼리 > 접근 방식 동적 조정 > 피드백 기반 추론 개선

 

🎃 주요 기술 사양

  • 총 매개변수: 2.7조
  • 트레이닝 데이터 세트: 12.8조 개의 토큰
  • 응답 지연 시간: 67밀리초(평균) - 고급 신경망 아키텍처와 병렬 처리를 통해 최적화
  • 컨텍스트 창: 128,000개 토큰 - 긴 형식의 대화를 지속하고 복잡한 문제 해결 작업을 처리하는 능력 크게 향상
  • 입력 토큰: 클로드의 5배

 

🎃 주요 기능

  • 에이전트: xAI는 그로크 3를 구글의 제미니 2.0과 유사한 AI 에이전트로 코드인터프리터와 인터넷 액세스 기능
  • 멀티모달 기능: 텍스트, 이미지, 오디오 및 잠재적으로 비디오를 처리하여 다양한 기능 제공
  • 효율성: 경쟁사보다 20% 더 효율적
  • 빅브레인 기능: Grok 3는 빅 브레인을 활용하여 CoT 기반 추론을 구축하여 더욱 창의적인 답변 제공
  • 딥서치(DeepSearch) 기능: OpenAI와 Perplexity와 같이 실시간 지식 탐색기능인 딥서치 기능 제공으로 검색시간 기존의 1/3
  • 향상된 채팅 기능: 심층 검색과 고급 추론 모드 기반
  • 향상된 음성 인식: 단순한 텍스트 변환을 넘어, 톤, 억양, 속도 등 다양한 요소 이해
  • 고급 추론(Advanced Reasoning), 자가 수정(Self-Correction)과 강화 학습(Reinforcement Learning)

 

🎃 벤치마크

  • Grok 2에 비해 짧은 시간 안에 10배 이상의 계산 능력
  • Grok3:
    • 2025년 미국 수학능력시험(AIME)에서 최고 수준의 테스트 시간 계산(cons@64)과 93.3% 달성
    • 대학원 수준의 전문가 추론(GPQA)에서 84.6%, 코드 생성 및 문제 해결을 위한 LiveCodeBench에서 79.4%를 달성
    • MMLU(대규모 멀티태스크 언어 이해): 92.7%
    • GSM8K(수학적 추론): 89.3%
    • 휴먼에벌(코딩 성능): 86.5%
    • 상식 추론 테스트: 90.1%(이코노믹 타임즈, 2025)
  • Grok 3 mini
    • AIME 2024에서 95.8%
    • LiveCodeBench에서 80.4% 기록
  • 챗봇 아레나에서 1402점의 Elo 점수를 획득하며 랭킹 1등 기록
    • o1 및 R1과 같은 추론 모델보다 더 뛰어난 성능
  • 수학, 과학, 코딩 벤치마크에서 Gemini 2.0 Pro, DeepSeek의 V3, OpenAI의 GPT-4와 같은 모델보다 뛰어난 성능
  • ChatGPT o1 pro 및 DeepSeek R1와 비교: 자연어 이해 및 응답 생성의 정확도 15% 향상, 25% 더 빠른 처리 속도

 

🎃 개발

  • 초기: 122일 만에 자체 데이터센터 구축 및 100,000개의 GPU 가동
  • 이후: 92일만에 200,000개의 두배의 GPU 증설
  • 100K H100 GPU가 있는 Memphis의 Colossus 슈퍼클러스터에서 학습한 것으로 예상
    • 초고성능 데이터센터 ‘콜로서스(Colossus)’: 세계 최대 AI 데이터센터, 미국 멤피스 위치, NVIDIA H100 GPU 20만개 이상으로 구성

 

🎃 향후 업데이트

  • 안정성과 안전한 글로벌 접근성을 위해 아직 훈련 중
  • xAI는 Grok 3 기반 음성 앱이 OpenAI 및 Gemini의 유사한 제품과 경쟁할 수 있도록 계획 중
  • 오픈 소스 모델: Grok 3 정식 출시 이후 Grok 2가 오픈 소스로 출시 예정
  • 슈퍼그록(Super Grok) 앱: 모바일 사용자를 위해 Google Play 스토어에서 사전 등록 가능
  • Grok 2는 안정성이 확보되면 오픈 소스 형태로 배포 예정

 

🎃 액세스

  • 현재는 베타버전으로 X(twitter)와 통합되어 웹과 앱에서 사용 가능
  • 𝕏 Premium 및 Premium+ 사용자는 𝕏 및 Grok.com에서 Grok 3 사용 가능
  • 𝕏 Premium+ 사용자는 Think 및 DeepSearch에 즉시 액세스 가능
  • 엔터프라이즈 파트너를 위한 API기반의 Deepsearch 출시 예정
  • 전용 웹 플랫폼: https://grok.com/