MiniMax M2는 중국 AI 기업 MiniMax의 고효율 경량 모델로, 엔드투엔드 코딩과 에이전트 워크플로우에 최적화되어 있습니다. 196K 토큰 컨텍스트를 지원하며, MMLU-PRO 82, MATH 96.8, GPQA 70, SWE-bench Verified 69.4로 견고한 성능을 기록합니다.
M2의 핵심 강점은 코딩 자동화 능력입니다. SWE-bench Verified 69.4점은 실제 GitHub 이슈를 자동으로 해결하는 능력을 보여주며, SWE-bench Bash-Only 61점과 TerminalBench 30점은 CLI 기반 작업 자동화에서도 실용적인 수준입니다. MATH 96.8점은 수학 추론에서 최상위 모델들에 근접하는 성능이며, HLE 12.5점은 고난도 추론에서의 기초 역량을 보여줍니다.
입력 1.00/1M 토큰으로 이 성능 수준에서는 매우 경쟁력 있는 가격입니다. MiniMax의 통합 멀티모달 플랫폼(음성, 이미지, 비디오)과 연동하면 텍스트 처리를 넘어선 종합 AI 서비스 구축이 가능합니다. 후속 모델인 M2.1과 M2.5가 추가 성능 개선을 제공합니다.
비용 효율적인 코딩 자동화 파이프라인, 수학 문제 풀이 시스템, 에이전트 기반 작업 자동화, 또는 MiniMax 생태계를 활용한 멀티모달 서비스에 적합합니다. 최신 성능이 필요하다면 M2.5로의 업그레이드를 권장합니다.
컨텍스트 윈도우
197K 토큰
라이선스
-
출시일
2025년 10월 24일
가성비 지수
5.8
API 가격 (혼합)
입력 $0.255/1M
조회수
0
API 가격 (USD 기준)
입력 (Prompt)
$0.26 / 1M 토큰
출력 (Completion)
$1.00 / 1M 토큰
태스크 관련 벤치마크 평균 점수
82.0
다양한 분야 지식 및 이해
59.8
수학, 과학, 논리적 추론
49.7
코드 생성, 버그 수정, 소프트웨어 엔지니어링
MiniMax
MiniMax의 다른 모델
꼭지점 클릭 → 벤치마크 행 이동
| 벤치마크 | 이 모델 | 단위 |
|---|---|---|
| GPQA | 70.0 | % |
| HLE |
| 모델 | LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval |
|---|---|
| MiniMax M2 | 82.1 |
| o1-pro | 86.4 |
| o3 | 88.8 |
| Grok 4.1 Fast | 74.4 |
| Command A | 69.1 |
| 12.5 |
| % |
| MATH Lvl 5 | 96.8 | % |
| MMLU-PRO | 82.0 | % |
| SWE-bench Bash-Only | 61.0 | % |
| SWE-bench Verified | 69.4 | % |
| TerminalBench | 30.0 | % |
| Mistral Large 3 2512 | 72.8 |