Gemini 3.1 Flash Lite Preview
Gemini 3.1 Flash Lite Preview ist Googles besonders günstige und schnelle Preview-Variante für volumenstarke Automatisierungsaufgaben. Das Modell ist nativ multimodal, unterstützt sehr lange Kontexte und eignet sich vor allem für Klassifikation, Extraktion und einfache Orchestrierung statt für tiefes Reasoning.
- Proprietär
- Server
- API
- General
- Multimodal
- Preview
- Real-Time
Sovereign Risk: MEDIUM Google ist ein US-amerikanisches Unternehmen und unterliegt dem CLOUD Act, jedoch sind die Modellgewichte nicht öffentlich zugänglich.
Schlüsselmetriken
Score · Latenz · Kosten · Qualität
- Total Score Silver
- 71.28
- Routine
- 43.42
- Reasoning
- 27.87
- LLM Judge Avg
- 3.64 / 5
- 100% Coverage
- Avg Task Duration
- 2.31s
- Real-Time
- Token Rate
- 235.63tok/s
- Output Rate
- P95 Latency
- 4.12s
- Top 5 %
- Total Tokens
- 37.9K
- Output Volume
- Cost per 1K
- $0.0015
- USD / 1K Requests
- Benchmark Cost
- $0.06
- Total · 37.9K tok
Benchmark-Module
7 Module · gewichtet · vs. Modellmedian & Spitzenreiter
Gemini 3.1 Flash Lite Preview
Bestes Modell
Ø Alle Modelle
Code Quality
67.16
CLI Benchmark
82
Logical Reasoning
77.04
UX Writing
71.27
Documentation
55.08
Content Transform.
77.53
Cultural Intelligence
74.24
Benchmark Cost
$0.06
Token-Effizienz & Latenz
Verbrauch pro Modul vs. Modellmedian