AI
[AI] xAI의 그록(Grok)3
H.Hoper
2025. 2. 25. 18:32
🎃 의미
- chocolate (Early Grok-3): 공개이전에 챗봇아레나에서 사용한 이름
- xAI에 개발중인 차세대 인텔리전스 AI 플랫폼
- xAI의 목적: 우주의 본질을 이해하고자 하는 AI(진리 추구)
- xAI 기업가치: 주당 95달러, 약 1조 1천억 기업 가치
- 최근 14조 규모의 투자 유치 협상 중
- 그록(Grok) = Heinlein의 공상과학소설 '낯선 땅의 이방인(Stranger in a Strange Land)'에서 유래된 "완전히 (깊이)이해하다"는 의미
- 그록(Grok)3: 이해력, 문제 해결력, 문맥 인식을 향상시키기 위해 설계된 Grok 시리즈의 3세대 AI 모델
- 모델: 베타 추론 모델인 Grok 3(Think)와 Grok 3 mini(Think) 발표
🎃 주요 학습
- 트랜스포머 기반 신경망(연쇄 사고 프로세스(CoT))과 고급 강화 학습
- 컨텍스트 쿼리 > 접근 방식 동적 조정 > 피드백 기반 추론 개선
🎃 주요 기술 사양
- 총 매개변수: 2.7조
- 트레이닝 데이터 세트: 12.8조 개의 토큰
- 응답 지연 시간: 67밀리초(평균) - 고급 신경망 아키텍처와 병렬 처리를 통해 최적화
- 컨텍스트 창: 128,000개 토큰 - 긴 형식의 대화를 지속하고 복잡한 문제 해결 작업을 처리하는 능력 크게 향상
- 입력 토큰: 클로드의 5배
🎃 주요 기능
- 에이전트: xAI는 그로크 3를 구글의 제미니 2.0과 유사한 AI 에이전트로 코드인터프리터와 인터넷 액세스 기능
- 멀티모달 기능: 텍스트, 이미지, 오디오 및 잠재적으로 비디오를 처리하여 다양한 기능 제공
- 효율성: 경쟁사보다 20% 더 효율적
- 빅브레인 기능: Grok 3는 빅 브레인을 활용하여 CoT 기반 추론을 구축하여 더욱 창의적인 답변 제공
- 딥서치(DeepSearch) 기능: OpenAI와 Perplexity와 같이 실시간 지식 탐색기능인 딥서치 기능 제공으로 검색시간 기존의 1/3
- 향상된 채팅 기능: 심층 검색과 고급 추론 모드 기반
- 향상된 음성 인식: 단순한 텍스트 변환을 넘어, 톤, 억양, 속도 등 다양한 요소 이해
- 고급 추론(Advanced Reasoning), 자가 수정(Self-Correction)과 강화 학습(Reinforcement Learning)
🎃 벤치마크
- Grok 2에 비해 짧은 시간 안에 10배 이상의 계산 능력
- Grok3:
- 2025년 미국 수학능력시험(AIME)에서 최고 수준의 테스트 시간 계산(cons@64)과 93.3% 달성
- 대학원 수준의 전문가 추론(GPQA)에서 84.6%, 코드 생성 및 문제 해결을 위한 LiveCodeBench에서 79.4%를 달성
- MMLU(대규모 멀티태스크 언어 이해): 92.7%
- GSM8K(수학적 추론): 89.3%
- 휴먼에벌(코딩 성능): 86.5%
- 상식 추론 테스트: 90.1%(이코노믹 타임즈, 2025)
- Grok 3 mini
- AIME 2024에서 95.8%
- LiveCodeBench에서 80.4% 기록
- 챗봇 아레나에서 1402점의 Elo 점수를 획득하며 랭킹 1등 기록
- o1 및 R1과 같은 추론 모델보다 더 뛰어난 성능
- 수학, 과학, 코딩 벤치마크에서 Gemini 2.0 Pro, DeepSeek의 V3, OpenAI의 GPT-4와 같은 모델보다 뛰어난 성능
- ChatGPT o1 pro 및 DeepSeek R1와 비교: 자연어 이해 및 응답 생성의 정확도 15% 향상, 25% 더 빠른 처리 속도
🎃 개발
- 초기: 122일 만에 자체 데이터센터 구축 및 100,000개의 GPU 가동
- 이후: 92일만에 200,000개의 두배의 GPU 증설
- 100K H100 GPU가 있는 Memphis의 Colossus 슈퍼클러스터에서 학습한 것으로 예상
- 초고성능 데이터센터 ‘콜로서스(Colossus)’: 세계 최대 AI 데이터센터, 미국 멤피스 위치, NVIDIA H100 GPU 20만개 이상으로 구성
🎃 향후 업데이트
- 안정성과 안전한 글로벌 접근성을 위해 아직 훈련 중
- xAI는 Grok 3 기반 음성 앱이 OpenAI 및 Gemini의 유사한 제품과 경쟁할 수 있도록 계획 중
- 오픈 소스 모델: Grok 3 정식 출시 이후 Grok 2가 오픈 소스로 출시 예정
- 슈퍼그록(Super Grok) 앱: 모바일 사용자를 위해 Google Play 스토어에서 사전 등록 가능
- Grok 2는 안정성이 확보되면 오픈 소스 형태로 배포 예정
🎃 액세스
- 현재는 베타버전으로 X(twitter)와 통합되어 웹과 앱에서 사용 가능
- 𝕏 Premium 및 Premium+ 사용자는 𝕏 및 Grok.com에서 Grok 3 사용 가능
- 𝕏 Premium+ 사용자는 Think 및 DeepSearch에 즉시 액세스 가능
- 엔터프라이즈 파트너를 위한 API기반의 Deepsearch 출시 예정
- 전용 웹 플랫폼: https://grok.com/
- source: https://x.ai/blog/grok-3