Grok 4.1 Fast는 xAI의 속도 최적화 에이전트 모델로, 2M 토큰(약 200만 토큰)이라는 업계 최대 수준의 컨텍스트 윈도우가 핵심 차별점입니다. MMLU-PRO 85.4, MMLU 92.5, Arena Elo 1461로 견고한 범용 성능과 초대형 컨텍스트를 동시에 제공하며, HumanEval 90점으로 코딩 능력도 우수합니다.

2M 토큰 컨텍스트의 실무적 의미는 혁신적입니다. 일반적인 128K-200K 컨텍스트 모델로는 불가능한 작업이 가능해집니다. 대규모 코드베이스 전체(수만 줄)를 한 번에 로드하여 아키텍처를 분석하거나, 수백 페이지 분량의 법률 계약서와 연구 논문을 동시에 비교 검토할 수 있습니다. 기존에 여러 차례 청크 분할과 컨텍스트 전달이 필요했던 작업을 한 번의 API 호출로 완료할 수 있어 워크플로우의 복잡도와 오류 가능성을 크게 줄입니다.

입력 $0.20/1M 토큰, 출력$ 0.50/1M 토큰으로 이 성능과 컨텍스트 수준에서는 업계 최저 수준의 가격입니다. 'Fast' 모델답게 응답 지연이 최소화되어 있으며, 도구 호출(tool calling)과 에이전트 워크플로우에 최적화되어 있어 AI 에이전트의 백본 모델로 적합합니다.

전체 프로젝트 코드 리뷰, 대규모 문서 요약, 장기간 대화 맥락 유지, 에이전트 기반 자동화 파이프라인, RAG 없이 전체 문서를 직접 주입하는 long-context 접근 등 '초대형 컨텍스트와 빠른 응답'이 동시에 필요한 시나리오에 최적의 선택지입니다.

벤치마크

이 모델

단위

Arena Elo

1461.0

elo

GPQA

60.0

HumanEval

모델

LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval

Grok 4.1 Fast

74.4

o1-pro

86.4

88.8

Command A

69.1

Mistral Large 3 2512

72.8

Grok 4.1 Fast

스펙

용도별 성능

Provider

분류

성능 평가

유사 모델 비교

댓글

벤치마크	카테고리	이 모델	전체 평균	전체 최고	단위
Arena Elo		1461.0	1369.2	1493.0	elo
GPQA	LLM	60.0	64.0	94.3	%
HumanEval	LLM