Gemini 3.5 Flash

Gemini 3.5 Flash ist Googles schnelles Flash-Modell für Coding, Agenten und multimodale Aufgaben mit sehr großem Kontextfenster. Die Card beschreibt es als effizienter als schwerere Gemini-Modelle, aber klar auf Geschwindigkeit und hohen Durchsatz optimiert. Es ist ausschließlich über die Google-API verfügbar.

Google Version 3.5-flash Kommerzielle Nutzung erlaubt MoE 1000 K Context 01/2026 $1.5 / $9 per 1M

  • Proprietär
  • Server
  • API
  • General
  • Multimodal
  • Real-Time

Sovereign Risk: MEDIUM Google ist ein US-amerikanisches Unternehmen und unterliegt dem CLOUD Act, jedoch sind die Modellgewichte nicht öffentlich zugänglich.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
69.38
Routine
41.2
Reasoning
28.17

Rank #65

LLM Judge Avg
3.52
100% Coverage
Avg Task Duration
9.51
Real-Time
Token Rate
57.09
Output Rate
P95 Latency
18.57
Top 5 %
Total Tokens
42.1K
Output Volume
Cost per 1K
$0.009
USD / 1K Requests
Benchmark Cost
$0.38
Total · 42.1K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Gemini 3.5 Flash Bestes Modell Ø Alle Modelle
Code Quality 73.2
CLI Benchmark 93.33
Logical Reasoning 69.3
UX Writing 70.75
Documentation 68.34
Content Transform. 75.16
Cultural Intelligence 47.6
Benchmark Cost $0.38

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil