MiniMax M2는 중국 AI 기업 MiniMax의 고효율 경량 모델로, 엔드투엔드 코딩과 에이전트 워크플로우에 최적화되어 있습니다. 196K 토큰 컨텍스트를 지원하며, MMLU-PRO 82, MATH 96.8, GPQA 70, SWE-bench Verified 69.4로 견고한 성능을 기록합니다.

M2의 핵심 강점은 코딩 자동화 능력입니다. SWE-bench Verified 69.4점은 실제 GitHub 이슈를 자동으로 해결하는 능력을 보여주며, SWE-bench Bash-Only 61점과 TerminalBench 30점은 CLI 기반 작업 자동화에서도 실용적인 수준입니다. MATH 96.8점은 수학 추론에서 최상위 모델들에 근접하는 성능이며, HLE 12.5점은 고난도 추론에서의 기초 역량을 보여줍니다.

입력 $0.255/1M 토큰, 출력$ 1.00/1M 토큰으로 이 성능 수준에서는 매우 경쟁력 있는 가격입니다. MiniMax의 통합 멀티모달 플랫폼(음성, 이미지, 비디오)과 연동하면 텍스트 처리를 넘어선 종합 AI 서비스 구축이 가능합니다. 후속 모델인 M2.1과 M2.5가 추가 성능 개선을 제공합니다.

비용 효율적인 코딩 자동화 파이프라인, 수학 문제 풀이 시스템, 에이전트 기반 작업 자동화, 또는 MiniMax 생태계를 활용한 멀티모달 서비스에 적합합니다. 최신 성능이 필요하다면 M2.5로의 업그레이드를 권장합니다.

벤치마크

이 모델

단위

GPQA

70.0

HLE

모델

LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval

MiniMax M2

82.1

o1-pro

86.4

88.8

Grok 4.1 Fast

74.4

Command A

69.1

MiniMax M2

스펙

용도별 성능

Provider

분류

성능 평가

유사 모델 비교

댓글

모델	Provider	LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval	Agentic 점수SWE·τ-bench·OSWorld·GAIA
MiniMax M2	MiniMax	82.1	-
o1-pro	OpenAI	86.4	-
o3	OpenAI	88.8	47.7
Grok 4.1 Fast	xAI	74.4	-
Command A	Cohere	69.1	-