Grok 4.1 Fast는 xAI의 속도 최적화 에이전트 모델로, 2M 토큰(약 200만 토큰)이라는 업계 최대 수준의 컨텍스트 윈도우가 핵심 차별점입니다. MMLU-PRO 85.4, MMLU 92.5, Arena Elo 1461로 견고한 범용 성능과 초대형 컨텍스트를 동시에 제공하며, HumanEval 90점으로 코딩 능력도 우수합니다.
2M 토큰 컨텍스트의 실무적 의미는 혁신적입니다. 일반적인 128K-200K 컨텍스트 모델로는 불가능한 작업이 가능해집니다. 대규모 코드베이스 전체(수만 줄)를 한 번에 로드하여 아키텍처를 분석하거나, 수백 페이지 분량의 법률 계약서와 연구 논문을 동시에 비교 검토할 수 있습니다. 기존에 여러 차례 청크 분할과 컨텍스트 전달이 필요했던 작업을 한 번의 API 호출로 완료할 수 있어 워크플로우의 복잡도와 오류 가능성을 크게 줄입니다.
입력 0.50/1M 토큰으로 이 성능과 컨텍스트 수준에서는 업계 최저 수준의 가격입니다. 'Fast' 모델답게 응답 지연이 최소화되어 있으며, 도구 호출(tool calling)과 에이전트 워크플로우에 최적화되어 있어 AI 에이전트의 백본 모델로 적합합니다.
전체 프로젝트 코드 리뷰, 대규모 문서 요약, 장기간 대화 맥락 유지, 에이전트 기반 자동화 파이프라인, RAG 없이 전체 문서를 직접 주입하는 long-context 접근 등 '초대형 컨텍스트와 빠른 응답'이 동시에 필요한 시나리오에 최적의 선택지입니다.
컨텍스트 윈도우
2.0M 토큰
라이선스
-
출시일
2025년 11월 20일
가성비 지수
15.1
API 가격 (혼합)
입력 $0.200/1M
조회수
0
API 가격 (USD 기준)
입력 (Prompt)
$0.20 / 1M 토큰
출력 (Completion)
$0.50 / 1M 토큰
태스크 관련 벤치마크 평균 점수
90.0
코드 생성, 버그 수정, 소프트웨어 엔지니어링
85.4
다양한 분야 지식 및 이해
60.0
수학, 과학, 논리적 추론
xAI
꼭지점 클릭 → 벤치마크 행 이동
| 벤치마크 | 이 모델 | 단위 |
|---|---|---|
| Arena Elo | 1461.0 | elo |
| GPQA | 60.0 | % |
| HumanEval |
| 모델 | LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval |
|---|---|
| Grok 4.1 Fast | 74.4 |
| o1-pro | 86.4 |
| o3 | 88.8 |
| Command A | 69.1 |
| Mistral Large 3 2512 | 72.8 |
| 90.0 |
| % |
| MMLU | 92.5 | % |
| MMLU-PRO | 85.4 | % |
| MiniMax M2.1 | - |