GLM 5는 중국 AI 기업 Z.ai(구 Zhipu AI)의 최신 플래그십 모델로, 복잡한 시스템 설계와 장기 에이전트 워크플로우에 특화되어 있습니다. 80K 토큰 컨텍스트를 지원하며, GPQA 86, AIME 2026 95.83, HMMT 2026 86.36이라는 최상위 벤치마크 성능을 기록합니다. 특히 수학 올림피아드 벤치마크에서의 성과는 글로벌 최고 수준입니다.
GLM 5의 가장 인상적인 분야는 코딩과 에이전트 능력입니다. SWE-bench Verified 72.8점, SWE-bench Multilingual 69.7점으로 다국어 코딩 환경에서도 강력한 성능을 보여주며, TerminalBench 52.4점은 터미널 기반 작업 자동화에서 업계 최고 수준입니다. HLE 30.5점은 인류 최종 시험에서의 탁월한 고난도 추론 능력을 입증합니다.
입력 2.30/1M 토큰으로 이 성능 수준에서는 경쟁력 있는 가격입니다. Z.ai는 중국의 주요 AI 연구소 중 하나로, 칭화대학교와의 긴밀한 협력을 기반으로 독자적인 GLM 아키텍처를 발전시켜 왔습니다.
복잡한 소프트웨어 엔지니어링 자동화, 수학 및 과학 연구 보조, 장기 에이전트 워크플로우, 다국어 코딩 환경에서의 자동화에 적합합니다. 특히 TerminalBench와 SWE-bench에서의 높은 점수는 DevOps 자동화와 코딩 에이전트 구축에 강력한 선택지임을 보여줍니다.
컨텍스트 윈도우
80K 토큰
라이선스
Proprietary
출시일
2026년 2월 12일
가성비 지수
2.9
API 가격 (혼합)
입력 $0.720/1M
조회수
0
API 가격 (USD 기준)
입력 (Prompt)
$0.72 / 1M 토큰
출력 (Completion)
$2.30 / 1M 토큰
태스크 관련 벤치마크 평균 점수
70.8
수학, 과학, 논리적 추론
62.6
코드 생성, 버그 수정, 소프트웨어 엔지니어링
Z.AI
Z.AI의 다른 모델
꼭지점 클릭 → 벤치마크 행 이동
| 벤치마크 | 이 모델 | 단위 |
|---|---|---|
| AIME 2026 | 95.8 | % |
| GPQA | 86.0 | % |
| 모델 | LLM 점수GPQA·MMLU·MATH·IFEval·HumanEval |
|---|---|
| GLM 5 | - |
| o1-pro | 86.4 |
| o3 | 88.8 |
| Grok 4.1 Fast | 74.4 |
| Command A | 69.1 |
| HLE |
| 30.5 |
| % |
| HMMT 2026 | 86.4 | % |
| SWE-bench Multilingual | 69.7 | % |
| SWE-bench Verified | 72.8 | % |
| TerminalBench | 52.4 | % |
| Mistral Large 3 2512 | 72.8 |