Claude 3 Haiku는 Anthropic이 2024년 3월에 출시한 3세대 경량 모델로, Claude 3 패밀리(Opus, Sonnet, Haiku) 중 가장 빠르고 저렴한 모델이다. 2026년 4월 기준 API 폐기(retirement)가 예정되어 있으며, 후속 모델인 Claude 3.5 Haiku와 Claude Haiku 4.5로 대체가 진행 중이다.
Claude 3 Haiku의 핵심 가치는 속도와 비용이다. 32K 토큰 미만 프롬프트 기준 초당 21,000 토큰을 처리하며, Anthropic API 기준 출력 속도 131.7 tokens/sec, 첫 토큰 출력(TTFT) 1.14초를 기록한다 (출처: artificialanalysis.ai). 같은 세대 경량 모델인 GPT-4o mini나 Gemini 1.5 Flash 대비 토큰 생성 속도에서 우위를 보인다.
200K 토큰 컨텍스트 윈도우를 지원해 약 30페이지 분량의 문서를 한 번에 처리할 수 있고, 이미지 입력도 가능한 멀티모달 모델이다. 다만 최대 출력이 4,096 토큰으로 제한되어 있어, 긴 문서 생성에는 적합하지 않다.
실사용자들은 "간단한 작업에 빠르게 답변을 받을 때 최적"이라는 평가가 많다. 반면 "조금이라도 복잡한 추론이 필요하면 Sonnet이나 다른 모델로 가야 한다"는 의견도 일관되게 나온다. 한국어 커뮤니티에서는 "영어 직역체가 자주 나온다", "응답을 길게 만들면 거의 무조건 직역체"라는 피드백이 있다.

Claude 3 Haiku가 실제로 잘 하는 작업은 명확하다. 텍스트 분류, 요약, 간단한 Q&A, 키워드 추출 같은 반복적이고 단순한 NLP 작업에서 비용 대비 좋은 결과를 낸다. 실시간 챗봇 백엔드로 쓰면 응답 지연이 거의 느껴지지 않는다.
이미지를 입력으로 받아 간단한 분석(OCR, 이미지 내 텍스트 추출, 기본적인 시각 질의응답)도 가능하다. Anthropic 공식 발표에서는 "영수증, 차트, 기술 다이어그램 해석" 등의 유스케이스를 강조했다.
반면, 안 되는 것도 분명하다. 고난도 수학(MATH Lvl 5: 38.9점), 대학원 수준 추론(GPQA: 33.3점)에서는 경쟁 모델 대비 확실히 뒤처진다. 코드 생성도 HumanEval 75.9점으로 기본적인 수준이며, 복잡한 멀티스텝 코딩 작업에는 부적합하다. Reddit 사용자들은 "Haiku로 간단한 스크립트는 되지만, 아키텍처 설계나 복잡한 디버깅은 Sonnet급이 필요하다"고 평가한다.
| 벤치마크 | Claude 3 Haiku | GPT-4o mini | Gemini 1.5 Flash |
|---|---|---|---|
| MMLU | 76.7 | 82.0 | 78.9 |
| GPQA | 33.3 | 40.2 | 37.5 |
| HumanEval | 75.9 | 87.2 | 74.3 |
| MATH Lvl 5 | 38.9 | 70.2 | 54.9 |
| IFEval | 76.0 | - | - |
| Arena Elo | 1179 | - | - |
(출처: Anthropic 공식 블로그, artificialanalysis.ai)
벤치마크 수치만 보면 Claude 3 Haiku는 세 모델 중 대부분의 항목에서 최하위다. 특히 MATH Lvl 5에서 38.9점은 GPT-4o mini(70.2)의 절반 수준이고, GPQA에서도 33.3점으로 고급 추론 능력이 부족하다. MMLU 76.7점은 기본적인 지식 수준을 갖추고 있음을 보여주지만, 경쟁 모델 대비 뒤처진다.
Artificial Analysis Intelligence Index에서 12점을 기록했는데, 이는 동급 모델 평균(15점)보다 낮다 (출처: artificialanalysis.ai).
실사용 체감으로도 비슷한 평가가 나온다. "벤치마크대로 추론이 약하다", "간단한 작업은 빠르게 잘 하는데, 조금만 난이도가 올라가면 한계가 보인다"는 피드백이 지배적이다. 다만 "속도가 워낙 빨라서, 단순 작업 대량 처리에는 오히려 효율적"이라는 긍정적 의견도 있다.

Claude 3 Haiku는 두 가지 방법으로 사용할 수 있다.
웹/앱 (일반 사용자): claude.ai에서 Claude Pro 구독($20/월) 시 Haiku를 포함한 전 모델을 사용할 수 있다. 무료 플랜에서도 제한적으로 접근 가능하다.
API (개발자): Anthropic API를 통해 직접 호출한다. 모델 ID는 claude-3-haiku-20240307이며, Messages API 형식으로 요청한다. Amazon Bedrock, Google Vertex AI를 통해서도 사용 가능하다. 프롬프트 캐싱(90% 절감)과 배치 API(50% 할인)를 조합하면 비용을 최대 95%까지 줄일 수 있다.
단, 2026년 4월 폐기 예정이므로 신규 프로젝트에서는 Claude Haiku 4.5(모델 ID: claude-haiku-4-5-20250415)로 시작하는 것을 권장한다.
입력 1.25/1M 토큰으로 Claude 전 라인업 중 가장 저렴하다. 하지만 경쟁 모델과 비교하면 얘기가 달라진다.
GPT-4o mini는 입력 0.60으로 Haiku보다 입력 40%, 출력 52% 더 저렴하다. Gemini 1.5 Flash는 입력 0.30으로 Haiku 대비 70% 이상 싸다. 즉 "Claude 중에서 가장 싸다"일 뿐, 경량 모델 시장 전체에서는 오히려 비싼 편이다 (출처: vantage.sh).
실사용자 가성비 평가는 "Claude 생태계 안에서 Haiku를 써야 하는 이유가 있는 경우에만 합리적"이라는 의견이 다수다. 순수 비용 효율을 따지면 GPT-4o mini나 Gemini Flash가 더 나은 선택이라는 평가가 지배적이다.
한국어 토큰 효율 데이터는 미공개 상태다. 다만 Claude 전반적으로 다국어 토크나이즈 최적화가 타사 대비 부족하며, 한국어 프롬프트 입력 시 토큰 소모가 더 빨리 일어난다는 한국어 커뮤니티 피드백이 있다 (출처: 나무위키).

| 항목 | 사양 |
|---|---|
| 개발사 | Anthropic |
| 출시일 | 2024년 3월 13일 |
| 모델 ID | claude-3-haiku-20240307 |
| 컨텍스트 윈도우 | 200,000 tokens |
| 최대 출력 | 4,096 tokens |
| 학습 데이터 기준일 | 2023년 8월 |
| 라이선스 | Proprietary (상용) |
| 멀티모달 | 텍스트 + 이미지 입력 |
| 출력 속도 | 131.7 tokens/sec (Anthropic API) |
| TTFT | 1.14초 (Anthropic API) |
| API 상태 | 2026년 4월 폐기 예정 |
| 후속 모델 | Claude 3.5 Haiku, Claude Haiku 4.5 |

컨텍스트 윈도우
200K 토큰
라이선스
Proprietary
출시일
2024년 3월 13일
학습 마감일
2023년 8월 31일
가성비 지수
4.7
API 가격 (혼합)
입력 $0.250/1M
조회수
0
API 가격 (USD 기준)
입력 (Prompt)
$0.25 / 1M 토큰
출력 (Completion)
$1.25 / 1M 토큰
태스크 관련 벤치마크 평균 점수
76.0
복잡한 지시사항 이해 및 수행
75.9
코드 생성, 버그 수정, 소프트웨어 엔지니어링
36.1
수학, 과학, 논리적 추론
Anthropic
꼭지점 클릭 → 벤치마크 행 이동
| 벤치마크 | 이 모델 | 단위 |
|---|---|---|
| Arena Elo | 1179.0 | elo |
| GPQA | 33.3 | % |
| 모델 | LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval |
|---|---|
| Claude 3 Haiku | 46.5 |
| Nova Pro 1.0 | 68.4 |
| Gemma 4 | 86.2 |
| Nova Premier 1.0 | 73.2 |
| GPT-4o-mini | 62.6 |
| HumanEval |
| 75.9 |
| % |
| IFEval | 76.0 | % |
| MATH Lvl 5 | 38.9 | % |
| MMLU | 76.7 | % |
| GPT-4o | 66.2 |
OpenAI: GPT-4o-mini
OpenAI