Grok 3

Grok 3 ist ein proprietäres xAI-Modell mit 1M Kontextfenster, Text-/Bildeingaben, Textausgabe und Tool-Support über die xAI-Plattform. In der aktuellen xAI-Dokumentation läuft der Alias grok-3 auf das neuere Grok-4.3-Modell weiter, wodurch der Name im Feld als Migrationsalias erhalten bleibt. Für Benchmarks ist daher wichtig, zwischen historischem Karten-Namen und aktuell hinterlegtem Backend zu unterscheiden.

xAI Version 3 Kommerzielle Nutzung erlaubt Dense 1000 K Context 11/2024 $5 / $15 per 1M

Proprietär
Frontier
API
General
Thinking-Optional
Vision-Capable
Long-Context
Interactive

Sovereign Risk: MEDIUM xAI ist ein US-Anbieter; die Gewichte sind nicht offen verfügbar. Relevante Risiken betreffen daher vor allem API-Datenverarbeitung unter US-Recht.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver: 73.67

Routine: 45.63
Reasoning: 28.04

Rank #30

LLM Judge Avg: 3.6; 100% Coverage

Avg Task Duration: 23.63; ️ Interactive

Token Rate: 62.72; Output Rate

P95 Latency: 59.71; Top 5 %

Total Tokens: 59.6K; Output Volume

Cost per 1K: $0.015; USD / 1K Requests

Benchmark Cost: $0.89; Total · 59.6K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Grok 3 Bestes Modell Ø Alle Modelle

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Grok 3

Schlüsselmetriken

Benchmark-Module

Token-Effizienz & Latenz

Token-Verbrauch pro Modul

Performance-Profil