Gemini 3.5 Flash
Gemini 3.5 Flash ist Googles schnelles Flash-Modell für Coding, Agenten und multimodale Aufgaben mit sehr großem Kontextfenster. Die Card beschreibt es als effizienter als schwerere Gemini-Modelle, aber klar auf Geschwindigkeit und hohen Durchsatz optimiert. Es ist ausschließlich über die Google-API verfügbar.
- Proprietär
- Server
- API
- General
- Multimodal
- Real-Time
Sovereign Risk: MEDIUM Google ist ein US-amerikanisches Unternehmen und unterliegt dem CLOUD Act, jedoch sind die Modellgewichte nicht öffentlich zugänglich.
Schlüsselmetriken
Score · Latenz · Kosten · Qualität
- Total Score Silver
- 69.38
- Routine
- 41.2
- Reasoning
- 28.17
- LLM Judge Avg
- 3.52 / 5
- 100% Coverage
- Avg Task Duration
- 9.51s
- Real-Time
- Token Rate
- 57.09tok/s
- Output Rate
- P95 Latency
- 18.57s
- Top 5 %
- Total Tokens
- 42.1K
- Output Volume
- Cost per 1K
- $0.009
- USD / 1K Requests
- Benchmark Cost
- $0.38
- Total · 42.1K tok
Benchmark-Module
7 Module · gewichtet · vs. Modellmedian & Spitzenreiter
Gemini 3.5 Flash
Bestes Modell
Ø Alle Modelle
Code Quality
73.2
CLI Benchmark
93.33
Logical Reasoning
69.3
UX Writing
70.75
Documentation
68.34
Content Transform.
75.16
Cultural Intelligence
47.6
Benchmark Cost
$0.38
Token-Effizienz & Latenz
Verbrauch pro Modul vs. Modellmedian