Gemini 3 Flash Preview
Gemini 3 Flash Preview ist Googles experimentelle Flash-Variante für schnelle, multimodale Aufgaben mit langer Kontextverarbeitung. Das Modell ist auf niedrige Latenz und hohe Effizienz ausgelegt und eignet sich vor allem für produktive Standardaufgaben statt für maximale Reasoning-Tiefe. Es bleibt exklusiv über die Google-API verfügbar.
- Proprietär
- Server
- API
- General
- Thinking-Optional
- Preview
- Real-Time
Sovereign Risk: MEDIUM Google DeepMind ist ein US-amerikanisches Unternehmen und unterliegt dem CLOUD Act; die Modellgewichte sind nicht öffentlich zugänglich.
Schlüsselmetriken
Score · Latenz · Kosten · Qualität
- Total Score Silver
- 69.29
- Routine
- 43.13
- Reasoning
- 26.16
- LLM Judge Avg
- 3.34 / 5
- 100% Coverage
- Avg Task Duration
- 9.52s
- Real-Time
- Token Rate
- 71.9tok/s
- Output Rate
- P95 Latency
- 20.33s
- Top 5 %
- Total Tokens
- 40.0K
- Output Volume
- Cost per 1K
- $0.003
- USD / 1K Requests
- Benchmark Cost
- $0.12
- Total · 40.0K tok
Benchmark-Module
7 Module · gewichtet · vs. Modellmedian & Spitzenreiter
Gemini 3 Flash Preview
Bestes Modell
Ø Alle Modelle
Code Quality
74.9
CLI Benchmark
90
Logical Reasoning
73.93
UX Writing
65.05
Documentation
62.99
Content Transform.
80.05
Cultural Intelligence
49.3
Benchmark Cost
$0.12
Token-Effizienz & Latenz
Verbrauch pro Modul vs. Modellmedian