GLM 5는 중국 AI 기업 Z.ai(구 Zhipu AI)의 최신 플래그십 모델로, 복잡한 시스템 설계와 장기 에이전트 워크플로우에 특화되어 있습니다. 80K 토큰 컨텍스트를 지원하며, GPQA 86, AIME 2026 95.83, HMMT 2026 86.36이라는 최상위 벤치마크 성능을 기록합니다. 특히 수학 올림피아드 벤치마크에서의 성과는 글로벌 최고 수준입니다.

GLM 5의 가장 인상적인 분야는 코딩과 에이전트 능력입니다. SWE-bench Verified 72.8점, SWE-bench Multilingual 69.7점으로 다국어 코딩 환경에서도 강력한 성능을 보여주며, TerminalBench 52.4점은 터미널 기반 작업 자동화에서 업계 최고 수준입니다. HLE 30.5점은 인류 최종 시험에서의 탁월한 고난도 추론 능력을 입증합니다.

입력 $0.72/1M 토큰, 출력$ 2.30/1M 토큰으로 이 성능 수준에서는 경쟁력 있는 가격입니다. Z.ai는 중국의 주요 AI 연구소 중 하나로, 칭화대학교와의 긴밀한 협력을 기반으로 독자적인 GLM 아키텍처를 발전시켜 왔습니다.

복잡한 소프트웨어 엔지니어링 자동화, 수학 및 과학 연구 보조, 장기 에이전트 워크플로우, 다국어 코딩 환경에서의 자동화에 적합합니다. 특히 TerminalBench와 SWE-bench에서의 높은 점수는 DevOps 자동화와 코딩 에이전트 구축에 강력한 선택지임을 보여줍니다.

벤치마크

이 모델

단위

AIME 2026

95.8

GPQA

86.0

모델

LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval

GLM 5

o1-pro

86.4

88.8

Grok 4.1 Fast

74.4

Command A

69.1

GLM 5

스펙

용도별 성능

Provider

분류

성능 평가

유사 모델 비교

댓글

모델	Provider	LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval	Agentic 점수SWE·τ-bench·OSWorld·GAIA
GLM 5	Z.AI	-	-
o1-pro	OpenAI	86.4	-
o3	OpenAI	88.8	47.7
Grok 4.1 Fast	xAI	74.4	-
Command A	Cohere	69.1