Qwen3.5-35B-A3B는 알리바바 클라우드의 최신 MoE 모델로, 35B 파라미터 중 추론 시 3B만 활성화하는 혁신적인 초효율 아키텍처입니다. 262K 토큰 컨텍스트를 지원하며, MMLU-PRO 85.3, GPQA 84.2, AIME 2026 93.33이라는 놀라운 벤치마크 성능을 기록합니다. 3B 활성 파라미터로 이 수준의 성능을 달성했다는 것은 AI 효율성의 새로운 기준입니다.

SWE-bench Verified 69.2점은 실제 GitHub 이슈를 자동으로 해결하는 소프트웨어 엔지니어링 역량을 보여주며, HMMT 2026 81.82점과 AIME 2026 93.33점은 올림피아드급 수학 대회 문제에서도 최상위 수준의 성능을 의미합니다. HLE 22.4점은 인류 최종 시험에서의 고난도 추론 능력을, TerminalBench 40.5점은 터미널 기반 실무 작업에서의 자동화 잠재력을 각각 입증합니다.

입력 $0.16/1M 토큰, 출력$ 1.30/1M 토큰으로 성능 대비 매우 경제적입니다. 3B 활성 파라미터라는 것은 스마트폰이나 태블릿 같은 엣지 디바이스에서도 양자화를 통해 실행할 수 있는 수준이며, 이는 클라우드와 엣지 AI의 경계를 허무는 혁신입니다. 서버에서는 동시 처리량이 극대화되어 비용 효율성이 더욱 높아집니다.

모바일 앱 내장 AI, IoT 디바이스, 오프라인 환경의 고성능 AI, 대량 추론 파이프라인 등 '작은 연산 자원으로 큰 성능'이 필요한 모든 시나리오에 혁신적인 선택지입니다. Qwen License로 상업적 사용이 가능하며, 네이티브 비전-언어 지원도 제공됩니다.

벤치마크

이 모델

단위

AIME 2026

93.3

GPQA

84.2

HLE

모델

LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval

Qwen3.5-35B-A3B

84.7

o1-pro

86.4

88.8

Grok 4.1 Fast

74.4

Command A

69.1

Qwen3.5-35B-A3B

스펙

용도별 성능

Provider

분류

성능 평가

유사 모델 비교

댓글

모델	Provider	LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval	Agentic 점수SWE·τ-bench·OSWorld·GAIA
Qwen3.5-35B-A3B	Qwen	84.7	-
o1-pro	OpenAI	86.4	-
o3	OpenAI	88.8	47.7
Grok 4.1 Fast	xAI	74.4	-
Command A	Cohere	69.1	-