Qwen2.5 72B Instruct는 알리바바 클라우드 Qwen 시리즈의 대형 밀집 모델로, Qwen3 이전 세대의 최고 성능 모델입니다. 32K 토큰 컨텍스트를 지원하며, MATH 83.1, HumanEval 86.6, IFEval 84.1, MMLU-PRO 71.1로 70B급 오픈소스 모델 중 최상위 수준입니다.

Qwen2.5 72B의 강점은 코딩과 수학에서의 뛰어난 성능입니다. MATH 83.1점은 같은 크기의 Llama 3.3 70B(77점)를 크게 앞서며, BBH 72.7%로 복합 추론에서도 우수합니다. 다국어 능력은 Qwen 시리즈의 전통적인 강점으로, 한국어, 중국어, 일본어 등에서 Llama 대비 현저한 우위를 보여줍니다. GPQA 49점은 과학적 추론에서도 실용적입니다.

입력 $0.12/1M 토큰, 출력$ 0.39/1M 토큰으로 70B급 모델 중 가장 저렴한 수준입니다. Qwen License로 상업적 사용이 가능하며, 오픈 웨이트로 자체 서버 호스팅도 가능합니다. 현재는 후속 Qwen3 시리즈가 더 나은 성능을 제공합니다.

Qwen2.5 기반으로 구축된 기존 파이프라인 유지보수, 다국어 텍스트 처리, 비용 효율적인 대형 모델 활용, 또는 Qwen3 이전 세대의 안정적인 성능이 필요한 프로덕션 환경에 적합합니다.

벤치마크	카테고리	이 모델	전체 평균	전체 최고	단위
BBH		0.7	21.6	93.1	%
GPQA	LLM	49.0

모델	Provider	LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval	Agentic 점수SWE·τ-bench·OSWorld·GAIA
Qwen2.5 72B Instruct	Qwen	70.3	-
o1-pro	OpenAI	86.4	-
o3	OpenAI	88.8	47.7
Grok 4.1 Fast	xAI	74.4	-
Command A	Cohere	69.1	-

Qwen2.5 72B Instruct

스펙

용도별 성능

Provider

분류

성능 평가

유사 모델 비교

관련 블로그 글

댓글