Grok 3

Grok 3 ist ein proprietäres xAI-Modell mit 1M Kontextfenster, Text-/Bildeingaben, Textausgabe und Tool-Support über die xAI-Plattform. In der aktuellen xAI-Dokumentation läuft der Alias grok-3 auf das neuere Grok-4.3-Modell weiter, wodurch der Name im Feld als Migrationsalias erhalten bleibt. Für Benchmarks ist daher wichtig, zwischen historischem Karten-Namen und aktuell hinterlegtem Backend zu unterscheiden.

xAI Version 3 Kommerzielle Nutzung erlaubt Dense 1000 K Context 11/2024 $5 / $15 per 1M

  • Proprietär
  • Frontier
  • API
  • General
  • Thinking-Optional
  • Vision-Capable
  • Long-Context
  • Interactive

Sovereign Risk: MEDIUM xAI ist ein US-Anbieter; die Gewichte sind nicht offen verfügbar. Relevante Risiken betreffen daher vor allem API-Datenverarbeitung unter US-Recht.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
73.67
Routine
45.63
Reasoning
28.04

Rank #30

LLM Judge Avg
3.6
100% Coverage
Avg Task Duration
23.63
️ Interactive
Token Rate
62.72
Output Rate
P95 Latency
59.71
Top 5 %
Total Tokens
59.6K
Output Volume
Cost per 1K
$0.015
USD / 1K Requests
Benchmark Cost
$0.89
Total · 59.6K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Grok 3 Bestes Modell Ø Alle Modelle
Code Quality 77.7
CLI Benchmark 88.67
Logical Reasoning 69.48
UX Writing 64.85
Documentation 66.97
Content Transform. 77.25
Cultural Intelligence 78.3
Benchmark Cost $0.89

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil