Mistral Nemo는 Mistral AI와 NVIDIA가 공동 개발한 12B 파라미터 경량 모델입니다. Apache 2.0 라이선스의 완전한 오픈소스 모델로, 128K 토큰이라는 소형 모델 치고는 파격적으로 큰 컨텍스트를 지원합니다. MMLU 68점으로 12B 크기에서 실용적인 기본 성능을 제공합니다.

Mistral Nemo의 독특한 포지션은 '12B 크기에 128K 컨텍스트'라는 조합입니다. 대부분의 12B 모델이 4K-16K 컨텍스트를 지원하는 데 반해, 128K는 장문 문서 처리에서 소형 모델의 한계를 크게 넓혀줍니다. NVIDIA와의 공동 개발로 NVIDIA GPU에서의 추론 최적화가 잘 되어 있으며, TensorRT-LLM 등 NVIDIA 추론 프레임워크와의 호환성이 뛰어납니다.

입력 $0.02/1M 토큰, 출력$ 0.04/1M 토큰으로 거의 무료에 가까운 가격입니다. 12B 크기는 단일 소비자 GPU(12GB VRAM)에서 양자화 없이도 실행 가능하며, 양자화 시 8GB VRAM에서도 구동됩니다. Apache 2.0 라이선스로 어떤 상업적 용도로도 자유롭게 사용 가능합니다.

긴 문서를 처리해야 하지만 대형 모델을 실행할 인프라가 없는 환경, 비용에 극도로 민감한 대량 텍스트 처리, NVIDIA GPU 최적화가 필요한 프로덕션 배포, 또는 경량 오픈소스 모델 기반의 파인튜닝에 적합합니다.

벤치마크	카테고리	이 모델	전체 평균	전체 최고	단위
BBH		0.5	21.6	93.1	%
GPQA	LLM	29.0	64.0	94.3

모델	Provider	LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval	Agentic 점수SWE·τ-bench·OSWorld·GAIA
Mistral Nemo	Mistral AI	30.1	-
o1-pro	OpenAI	86.4	-
o3	OpenAI	88.8	47.7
Grok 4.1 Fast	xAI	74.4	-
Command A	Cohere	69.1	-

Mistral Nemo

스펙

용도별 성능

Provider

분류

성능 평가

유사 모델 비교

관련 블로그 글

댓글