GPT-4 Turbo는 GPT-4의 개선 버전으로, 비전 기능을 포함하며 128K 토큰 컨텍스트를 지원합니다. JSON 모드와 함수 호출(function calling)을 비전 요청에서도 사용할 수 있는 최초의 GPT-4 변형입니다. MMLU 86.5, HumanEval 87.6, MATH 72.2, GSM8K 95.3으로 안정적인 성능을 기록합니다.

GPT-4 Turbo는 GPT-4의 높은 품질을 유지하면서 속도와 비용을 개선한 모델입니다. 128K 컨텍스트는 원본 GPT-4의 8K보다 16배 크며, 이를 통해 장문 문서 처리와 복잡한 대화에 더 적합해졌습니다. Arena Elo 1257로 안정적인 사용자 평가를 받고 있으며, GPQA 49.1점은 과학적 추론에서도 실용적인 수준입니다.

입력 $10/1M 토큰, 출력$ 30/1M 토큰으로 후속 모델(GPT-4o, GPT-4.1)보다 비싼 편입니다. 현시점에서는 GPT-4o나 GPT-4.1이 더 나은 성능을 더 낮은 가격에 제공하므로, 신규 프로젝트에서는 후속 모델로의 전환을 권장합니다. 다만 기존 파이프라인에서 GPT-4 Turbo에 최적화된 프롬프트를 사용 중이라면 즉시 전환 시 출력 품질의 변화가 있을 수 있습니다.

GPT-4 Turbo 기반으로 이미 구축된 프로덕션 시스템의 유지보수, 또는 GPT-4 시리즈 특유의 출력 스타일이 필요한 특수한 경우에 계속 사용됩니다. 새로운 프로젝트를 시작한다면 GPT-4.1이나 GPT-4o로 시작하는 것을 권장합니다.

벤치마크

이 모델

단위

Arena Elo

1257.0

elo

GPQA

49.1

GSM8K

모델

LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval

GPT-4 Turbo

63.9

o1-pro

86.4

88.8

Grok 4.1 Fast

74.4

Command A

69.1

GPT-4 Turbo

스펙

용도별 성능

Provider

분류

성능 평가

유사 모델 비교

댓글

모델	Provider	LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval	Agentic 점수SWE·τ-bench·OSWorld·GAIA
GPT-4 Turbo	OpenAI	63.9	-
o1-pro	OpenAI	86.4	-
o3	OpenAI	88.8	47.7
Grok 4.1 Fast	xAI	74.4	-
Command A	Cohere	69.1	-