GLM-5.2

GLM-5.2 ist Z.AIs aktuelles Flaggschiff mit 744 Milliarden Gesamt- und 40 Milliarden aktiven Parametern in MoE-Architektur, optimiert für komplexe Engineering-Workflows und langlaufende Coding-Aufgaben. Das Kontextfenster umfasst eine Million Tokens, die Gewichte sind unter MIT-Lizenz als Open-Weights-Modell verfügbar.

Zhipu AI Version 5.2 Kommerzielle Nutzung erlaubt MoE 744 B (40 B aktiv) 1000 K Context 12/2025 $1.4 / $4.4 per 1M

  • Open Weights
  • Frontier
  • OR
  • Text
  • Instruction-Tuned
  • Agentic Orchestrator
  • Interactive

Sovereign Risk: HIGH Z.AI (formerly Zhipu AI) ist ein chinesisches Unternehmen und unterliegt dem chinesischen National Security Law (NSL), das staatlichen Zugriff auf Daten ermöglichen kann. Das BSI hat im Februar 2025 explizit vor der Nutzung chinesischer KI-Cloud-Dienste gewarnt (BSI-Referenz: Warnung DeepSeek, 04.02.2025); diese Risikoeinschätzung gilt analog für alle chinesischen Cloud-KI-Anbieter, die Nutzerdaten auf chinesischen Servern verarbeiten. Bei rein lokaler Inferenz mit den MIT-lizenzierten Gewichten entfällt das Cloud-Act-äquivalente Risiko.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
73.92
Routine
46.43
Reasoning
27.49

Rank #27

LLM Judge Avg
3.74
100 Coverage
Avg Task Duration
38.56
️ Interactive
Token Rate
22.55
Output Rate
P95 Latency
99.58
Top 5 %
Total Tokens
89600
Output Volume
Cost per 1K
$0.0044
USD / 1K Requests
Benchmark Cost
$0.39
Total · 89600 tok

Benchmark-Module

10 Module · gewichtet · vs. Modellmedian & Spitzenreiter

GLM-5.2 Bestes Modell Ø Alle Modelle
Code Quality 72.64
CLI Benchmark 93
Logical Reasoning 68.87
UX Writing 72.81
Documentation 65.47
Content Transform. 78.84
Cultural Intelligence 75.32
Synthesis Quality 55.83
Tool Execution 90
ToolUse Score 72.79
Benchmark Cost $0.39

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil