Qwen3 32B는 Alibaba Qwen 팀이 개발한 32B 파라미터 언어 모델로, 사고(thinking)와 비사고(non-thinking) 모드를 자유롭게 전환할 수 있는 하이브리드 추론 아키텍처가 핵심 특징입니다. 간단한 질문에는 즉시 답하고, 복잡한 수학이나 추론 문제에서는 단계적으로 깊이 사고하는 능력을 모두 갖추고 있습니다. MMLU 92.8%라는 놀라운 일반 지식 수준은 32B 크기의 모델에서는 전례 없는 성능으로, 수배 더 큰 모델들과 동등하거나 그 이상입니다. MATH Lvl 5 95.2%로 국제 수학 올림피아드급 문제를 풀 수 있는 고급 수학 추론력을 갖추고 있으며, IFEval 91.6%의 높은 지시 따르기 정확도와 GSM8K 93.4%의 안정적인 기초 수학 성능도 보여줍니다. GPQA 60%로 대학원 수준 과학 문제에서도 기본적인 경쟁력이 있고, Arena Elo 1347로 훨씬 큰 파라미터의 모델들과 대등한 사용자 선호도를 기록합니다. 40K 토큰 컨텍스트에 입력 0.24/1M 토큰이라는 초저가는 GPT-4o 대비 30배 이상 저렴합니다. Qwen License 하에 오픈소스 공개되어 자체 호스팅과 파인튜닝이 가능하며, 함수 호출(Function Calling)을 네이티브 지원하여 에이전트 시스템 구축에도 적합합니다. 가격 대비 성능에서 오픈소스 모델 중 최강급이라는 평가를 받고 있습니다.
컨텍스트 윈도우
41K 토큰
라이선스
Qwen License
출시일
2025년 4월 29일
학습 마감일
2025년 3월 31일
가성비 지수
33.8
API 가격 (혼합)
입력 $0.080/1M
조회수
0
API 가격 (USD 기준)
입력 (Prompt)
$0.08 / 1M 토큰
출력 (Completion)
$0.24 / 1M 토큰
태스크 관련 벤치마크 평균 점수
91.6
복잡한 지시사항 이해 및 수행
77.6
수학, 과학, 논리적 추론
Qwen
꼭지점 클릭 → 벤치마크 행 이동
| 벤치마크 | 이 모델 | 단위 |
|---|---|---|
| Arena Elo | 1347.0 | elo |
| GPQA | 60.0 | % |
| GSM8K |
| 모델 | LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval |
|---|---|
| Qwen3 32B | 78.4 |
| o1-pro | 86.4 |
| o3 | 88.8 |
| Grok 4.1 Fast | 74.4 |
| Command A | 69.1 |
| 93.4 |
| % |
| IFEval | 91.6 | % |
| MATH Lvl 5 | 95.2 | % |
| MMLU | 92.8 | % |
| Mistral Large 3 2512 | 72.8 |