Grok 4 Fast Non-Reasoning

Grok 4 Fast Non-Reasoning ist xAIs schnelle Variante für kosteneffiziente Antwortzeiten und einfache allgemeine Aufgaben. Die Modellfamilie ist auf niedrige Latenz, Web- und X-Suche sowie hohe Token-Effizienz ausgelegt; diese Variante verzichtet auf explizites Reasoning und bleibt damit bei komplexen Denkaufgaben bewusst schlanker.

xAI Version 4-fast-non-reasoning Kommerzielle Nutzung erlaubt MoE 128 K Context 03/2026 $0.2 / $1 per 1M

  • Proprietär
  • Frontier
  • API
  • General
  • No-Reasoning
  • Real-Time

Sovereign Risk: MEDIUM xAI ist ein US-amerikanisches Unternehmen und unterliegt dem CLOUD Act, jedoch sind die Modellgewichte nicht öffentlich zugänglich.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
74.7
Routine
46.73
Reasoning
27.98

Rank #15

LLM Judge Avg
3.67
100% Coverage
Avg Task Duration
5.71
Real-Time
Token Rate
190.26
Output Rate
P95 Latency
13.26
Top 5 %
Total Tokens
61.2K
Output Volume
Cost per 1K
$0.001
USD / 1K Requests
Benchmark Cost
$0.06
Total · 61.2K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Grok 4 Fast Non-Reasoning Bestes Modell Ø Alle Modelle
Code Quality 76.4
CLI Benchmark 87.67
Logical Reasoning 68.23
UX Writing 71.75
Documentation 76.97
Content Transform. 75.54
Cultural Intelligence 73.3
Benchmark Cost $0.06

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil