Qwen3.5-35B-A3B는 알리바바 클라우드의 최신 MoE 모델로, 35B 파라미터 중 추론 시 3B만 활성화하는 혁신적인 초효율 아키텍처입니다. 262K 토큰 컨텍스트를 지원하며, MMLU-PRO 85.3, GPQA 84.2, AIME 2026 93.33이라는 놀라운 벤치마크 성능을 기록합니다. 3B 활성 파라미터로 이 수준의 성능을 달성했다는 것은 AI 효율성의 새로운 기준입니다.
SWE-bench Verified 69.2점은 실제 GitHub 이슈를 자동으로 해결하는 소프트웨어 엔지니어링 역량을 보여주며, HMMT 2026 81.82점과 AIME 2026 93.33점은 올림피아드급 수학 대회 문제에서도 최상위 수준의 성능을 의미합니다. HLE 22.4점은 인류 최종 시험에서의 고난도 추론 능력을, TerminalBench 40.5점은 터미널 기반 실무 작업에서의 자동화 잠재력을 각각 입증합니다.
입력 1.30/1M 토큰으로 성능 대비 매우 경제적입니다. 3B 활성 파라미터라는 것은 스마트폰이나 태블릿 같은 엣지 디바이스에서도 양자화를 통해 실행할 수 있는 수준이며, 이는 클라우드와 엣지 AI의 경계를 허무는 혁신입니다. 서버에서는 동시 처리량이 극대화되어 비용 효율성이 더욱 높아집니다.
모바일 앱 내장 AI, IoT 디바이스, 오프라인 환경의 고성능 AI, 대량 추론 파이프라인 등 '작은 연산 자원으로 큰 성능'이 필요한 모든 시나리오에 혁신적인 선택지입니다. Qwen License로 상업적 사용이 가능하며, 네이티브 비전-언어 지원도 제공됩니다.
컨텍스트 윈도우
262K 토큰
라이선스
Qwen License
출시일
2026년 2월 26일
가성비 지수
5.2
API 가격 (혼합)
입력 $0.163/1M
조회수
0
API 가격 (USD 기준)
입력 (Prompt)
$0.16 / 1M 토큰
출력 (Completion)
$1.30 / 1M 토큰
태스크 관련 벤치마크 평균 점수
85.3
다양한 분야 지식 및 이해
66.6
수학, 과학, 논리적 추론
54.9
코드 생성, 버그 수정, 소프트웨어 엔지니어링
Qwen
꼭지점 클릭 → 벤치마크 행 이동
| 벤치마크 | 이 모델 | 단위 |
|---|---|---|
| AIME 2026 | 93.3 | % |
| GPQA | 84.2 | % |
| HLE |
| 모델 | LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval |
|---|---|
| Qwen3.5-35B-A3B | 84.7 |
| o1-pro | 86.4 |
| o3 | 88.8 |
| Grok 4.1 Fast | 74.4 |
| Command A | 69.1 |
| 22.4 |
| % |
| HMMT 2026 | 81.8 | % |
| MMLU-PRO | 85.3 | % |
| SWE-bench Verified | 69.2 | % |
| TerminalBench | 40.5 | % |
| Mistral Large 3 2512 | 72.8 |