Grok 3
Grok 3 ist ein proprietäres xAI-Modell mit 1M Kontextfenster, Text-/Bildeingaben, Textausgabe und Tool-Support über die xAI-Plattform. In der aktuellen xAI-Dokumentation läuft der Alias grok-3 auf das neuere Grok-4.3-Modell weiter, wodurch der Name im Feld als Migrationsalias erhalten bleibt. Für Benchmarks ist daher wichtig, zwischen historischem Karten-Namen und aktuell hinterlegtem Backend zu unterscheiden.
- Proprietär
- Frontier
- API
- General
- Thinking-Optional
- Vision-Capable
- Long-Context
- Interactive
Sovereign Risk: MEDIUM xAI ist ein US-Anbieter; die Gewichte sind nicht offen verfügbar. Relevante Risiken betreffen daher vor allem API-Datenverarbeitung unter US-Recht.
Schlüsselmetriken
Score · Latenz · Kosten · Qualität
- Total Score Silver
- 73.67
- Routine
- 45.63
- Reasoning
- 28.04
- LLM Judge Avg
- 3.6 / 5
- 100% Coverage
- Avg Task Duration
- 23.63s
- ️ Interactive
- Token Rate
- 62.72tok/s
- Output Rate
- P95 Latency
- 59.71s
- Top 5 %
- Total Tokens
- 59.6K
- Output Volume
- Cost per 1K
- $0.015
- USD / 1K Requests
- Benchmark Cost
- $0.89
- Total · 59.6K tok
Benchmark-Module
7 Module · gewichtet · vs. Modellmedian & Spitzenreiter
Token-Effizienz & Latenz
Verbrauch pro Modul vs. Modellmedian