Gemini 3.1 Flash Lite Preview

Gemini 3.1 Flash Lite Preview ist Googles besonders günstige und schnelle Preview-Variante für volumenstarke Automatisierungsaufgaben. Das Modell ist nativ multimodal, unterstützt sehr lange Kontexte und eignet sich vor allem für Klassifikation, Extraktion und einfache Orchestrierung statt für tiefes Reasoning.

Google Version 3.1-flash-lite-preview Kommerzielle Nutzung erlaubt MoE 1000 K Context 01/2026 $0.25 / $1.5 per 1M

Proprietär
Server
API
General
Multimodal
Preview
Real-Time

Sovereign Risk: MEDIUM Google ist ein US-amerikanisches Unternehmen und unterliegt dem CLOUD Act, jedoch sind die Modellgewichte nicht öffentlich zugänglich.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver: 71.28

Routine: 43.42
Reasoning: 27.87

Rank #53

LLM Judge Avg: 3.64; 100% Coverage

Avg Task Duration: 2.31; Real-Time

Token Rate: 235.63; Output Rate

P95 Latency: 4.12; Top 5 %

Total Tokens: 37.9K; Output Volume

Cost per 1K: $0.0015; USD / 1K Requests

Benchmark Cost: $0.06; Total · 37.9K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Gemini 3.1 Flash Lite Preview Bestes Modell Ø Alle Modelle

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Gemini 3.1 Flash Lite Preview

Schlüsselmetriken

Benchmark-Module

Token-Effizienz & Latenz

Token-Verbrauch pro Modul

Performance-Profil