Qwen3 32B는 Alibaba Qwen 팀이 개발한 32B 파라미터 언어 모델로, 사고(thinking)와 비사고(non-thinking) 모드를 자유롭게 전환할 수 있는 하이브리드 추론 아키텍처가 핵심 특징입니다. 간단한 질문에는 즉시 답하고, 복잡한 수학이나 추론 문제에서는 단계적으로 깊이 사고하는 능력을 모두 갖추고 있습니다. MMLU 92.8%라는 놀라운 일반 지식 수준은 32B 크기의 모델에서는 전례 없는 성능으로, 수배 더 큰 모델들과 동등하거나 그 이상입니다. MATH Lvl 5 95.2%로 국제 수학 올림피아드급 문제를 풀 수 있는 고급 수학 추론력을 갖추고 있으며, IFEval 91.6%의 높은 지시 따르기 정확도와 GSM8K 93.4%의 안정적인 기초 수학 성능도 보여줍니다. GPQA 60%로 대학원 수준 과학 문제에서도 기본적인 경쟁력이 있고, Arena Elo 1347로 훨씬 큰 파라미터의 모델들과 대등한 사용자 선호도를 기록합니다. 40K 토큰 컨텍스트에 입력 $0.08, 출력$ 0.24/1M 토큰이라는 초저가는 GPT-4o 대비 30배 이상 저렴합니다. Qwen License 하에 오픈소스 공개되어 자체 호스팅과 파인튜닝이 가능하며, 함수 호출(Function Calling)을 네이티브 지원하여 에이전트 시스템 구축에도 적합합니다. 가격 대비 성능에서 오픈소스 모델 중 최강급이라는 평가를 받고 있습니다.

벤치마크

이 모델

단위

Arena Elo

1347.0

elo

GPQA

60.0

GSM8K

모델

LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval

Qwen3 32B

78.4

o1-pro

86.4

88.8

Grok 4.1 Fast

74.4

Command A

69.1

Qwen3 32B

스펙

용도별 성능

Provider

분류

성능 평가

유사 모델 비교

댓글

모델	Provider	LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval	Agentic 점수SWE·τ-bench·OSWorld·GAIA
Qwen3 32B	Qwen	78.4	-
o1-pro	OpenAI	86.4	-
o3	OpenAI	88.8	47.7
Grok 4.1 Fast	xAI	74.4	-
Command A	Cohere	69.1	-