GPT-4 Turbo는 GPT-4의 개선 버전으로, 비전 기능을 포함하며 128K 토큰 컨텍스트를 지원합니다. JSON 모드와 함수 호출(function calling)을 비전 요청에서도 사용할 수 있는 최초의 GPT-4 변형입니다. MMLU 86.5, HumanEval 87.6, MATH 72.2, GSM8K 95.3으로 안정적인 성능을 기록합니다.
GPT-4 Turbo는 GPT-4의 높은 품질을 유지하면서 속도와 비용을 개선한 모델입니다. 128K 컨텍스트는 원본 GPT-4의 8K보다 16배 크며, 이를 통해 장문 문서 처리와 복잡한 대화에 더 적합해졌습니다. Arena Elo 1257로 안정적인 사용자 평가를 받고 있으며, GPQA 49.1점은 과학적 추론에서도 실용적인 수준입니다.
입력 30/1M 토큰으로 후속 모델(GPT-4o, GPT-4.1)보다 비싼 편입니다. 현시점에서는 GPT-4o나 GPT-4.1이 더 나은 성능을 더 낮은 가격에 제공하므로, 신규 프로젝트에서는 후속 모델로의 전환을 권장합니다. 다만 기존 파이프라인에서 GPT-4 Turbo에 최적화된 프롬프트를 사용 중이라면 즉시 전환 시 출력 품질의 변화가 있을 수 있습니다.
GPT-4 Turbo 기반으로 이미 구축된 프로덕션 시스템의 유지보수, 또는 GPT-4 시리즈 특유의 출력 스타일이 필요한 특수한 경우에 계속 사용됩니다. 새로운 프로젝트를 시작한다면 GPT-4.1이나 GPT-4o로 시작하는 것을 권장합니다.
컨텍스트 윈도우
128K 토큰
라이선스
Proprietary
출시일
2024년 4월 9일
학습 마감일
2023년 12월 31일
가성비 지수
0.2
API 가격 (혼합)
입력 $10.00/1M
조회수
0
API 가격 (USD 기준)
입력 (Prompt)
$10.00 / 1M 토큰
출력 (Completion)
$30.00 / 1M 토큰
태스크 관련 벤치마크 평균 점수
87.6
코드 생성, 버그 수정, 소프트웨어 엔지니어링
60.7
수학, 과학, 논리적 추론
OpenAI
꼭지점 클릭 → 벤치마크 행 이동
| 벤치마크 | 이 모델 | 단위 |
|---|---|---|
| Arena Elo | 1257.0 | elo |
| GPQA | 49.1 | % |
| GSM8K |
| 모델 | LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval |
|---|---|
| GPT-4 Turbo | 63.9 |
| o1-pro | 86.4 |
| o3 | 88.8 |
| Grok 4.1 Fast | 74.4 |
| Command A | 69.1 |
| 95.3 |
| % |
| HumanEval | 87.6 | % |
| MATH Lvl 5 | 72.2 | % |
| MMLU | 86.5 | % |
| Mistral Large 3 2512 | 72.8 |