Grok 4.1 Fast Reasoning

Grok 4.1 Fast Reasoning ist xAIs schnelle Reasoning-Variante für agentische Workflows und hohe Latenzanforderungen. Die Card verweist auf ein sehr großes Kontextfenster, Tool-Use und Web-Suche. Das Modell ist proprietär, über die API nutzbar und als deprecated markiert.

xAI Version 4-1-reasoning Kommerzielle Nutzung erlaubt Dense 2000 K Context 06/2025 $1.25 / $2.5 per 1M

  • Proprietär
  • Frontier
  • API
  • Thinking
  • Real-Time

Sovereign Risk: MEDIUM xAI ist ein US-amerikanisches Unternehmen und unterliegt dem CLOUD Act, jedoch nicht dem chinesischen NSL; Gewichte sind nicht öffentlich verfügbar.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
72.6
Routine
44.92
Reasoning
27.68

Rank #44

LLM Judge Avg
3.6
100% Coverage
Avg Task Duration
12.35
Real-Time
Token Rate
65.02
Output Rate
P95 Latency
27.93
Top 5 %
Total Tokens
48.1K
Output Volume
Cost per 1K
$0.0025
USD / 1K Requests
Benchmark Cost
$0.12
Total · 48.1K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Grok 4.1 Fast Reasoning Bestes Modell Ø Alle Modelle
Code Quality 72.9
CLI Benchmark 91.67
Logical Reasoning 69.44
UX Writing 67.35
Documentation 60.64
Content Transform. 78.03
Cultural Intelligence 75.3
Benchmark Cost $0.12

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil