MiniMax M2.1은 중국 AI 기업 MiniMax의 중간 업데이트 모델로, M2의 안정성과 출력 품질을 개선한 버전입니다. 196K 토큰의 넉넉한 컨텍스트 윈도우를 제공하며, MMLU-PRO 88점, SWE-bench Verified 74점으로 코딩 작업에서 글로벌 최상위 모델들과 경쟁하는 수준의 성능을 보여줍니다.

M2.1의 주요 개선점은 지시 따르기(instruction following) 능력과 장문 생성에서의 일관성입니다. 특히 복잡한 지시사항을 여러 단계에 걸쳐 정확하게 수행하는 능력이 M2 대비 크게 향상되었습니다. SWE-Pro 36.81점은 실제 소프트웨어 개발 시나리오에서의 에이전트 활용 가능성을 보여주며, HLE 22.2점은 인류 최종 시험(Humanity's Last Exam)이라 불리는 최고 난이도 벤치마크에서도 견고한 추론 능력을 입증합니다.

입력 $0.27/1M 토큰, 출력$ 0.95/1M 토큰으로 성능 대비 매우 경제적인 가격 구조를 갖추고 있습니다. 동일 수준의 SWE-bench 점수를 기록하는 Claude나 GPT 모델 대비 상당히 저렴하여, 비용에 민감한 대량 처리 워크플로우에 적합합니다. MiniMax는 텍스트뿐 아니라 음성 합성(TTS), 이미지 생성 등 멀티모달 서비스를 통합 제공하는 풀스택 AI 플랫폼으로, M2.1은 이 생태계의 핵심 언어 엔진입니다.

중국어 콘텐츠 생성, 아시아 시장 타겟 서비스 구축, 코딩 에이전트 파이프라인, 또는 MiniMax의 멀티모달 API와 연동한 통합 AI 솔루션에 적합합니다. 글로벌 API도 제공되어 해외 개발자도 직접 접근 가능하며, TerminalBench 29.2점으로 CLI 환경에서의 작업 자동화에도 활용됩니다.

벤치마크

이 모델

단위

EvasionBench

71.3

HLE

22.2

MMLU-PRO

88.0

모델

LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval

MiniMax M2.1

o1-pro

86.4

88.8

Grok 4.1 Fast

74.4

Command A

69.1

MiniMax M2.1

스펙

용도별 성능

Provider

분류

성능 평가

유사 모델 비교

댓글

모델	Provider	LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval	Agentic 점수SWE·τ-bench·OSWorld·GAIA
MiniMax M2.1	MiniMax	-	-
o1-pro	OpenAI	86.4	-
o3	OpenAI	88.8	47.7
Grok 4.1 Fast	xAI	74.4	-
Command A	Cohere	69.1