Gemini 3 Flash Preview

Gemini 3 Flash Preview ist Googles experimentelle Flash-Variante für schnelle, multimodale Aufgaben mit langer Kontextverarbeitung. Das Modell ist auf niedrige Latenz und hohe Effizienz ausgelegt und eignet sich vor allem für produktive Standardaufgaben statt für maximale Reasoning-Tiefe. Es bleibt exklusiv über die Google-API verfügbar.

Google Version 3-flash-preview Kommerzielle Nutzung erlaubt Dense 1000 K Context 01/2026 $0.5 / $3 per 1M

  • Proprietär
  • Server
  • API
  • General
  • Thinking-Optional
  • Preview
  • Real-Time

Sovereign Risk: MEDIUM Google DeepMind ist ein US-amerikanisches Unternehmen und unterliegt dem CLOUD Act; die Modellgewichte sind nicht öffentlich zugänglich.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
69.29
Routine
43.13
Reasoning
26.16

Rank #66

LLM Judge Avg
3.34
100% Coverage
Avg Task Duration
9.52
Real-Time
Token Rate
71.9
Output Rate
P95 Latency
20.33
Top 5 %
Total Tokens
40.0K
Output Volume
Cost per 1K
$0.003
USD / 1K Requests
Benchmark Cost
$0.12
Total · 40.0K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Gemini 3 Flash Preview Bestes Modell Ø Alle Modelle
Code Quality 74.9
CLI Benchmark 90
Logical Reasoning 73.93
UX Writing 65.05
Documentation 62.99
Content Transform. 80.05
Cultural Intelligence 49.3
Benchmark Cost $0.12

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil