Gemini 3.1 Flash Lite Preview

Gemini 3.1 Flash Lite Preview ist Googles besonders günstige und schnelle Preview-Variante für volumenstarke Automatisierungsaufgaben. Das Modell ist nativ multimodal, unterstützt sehr lange Kontexte und eignet sich vor allem für Klassifikation, Extraktion und einfache Orchestrierung statt für tiefes Reasoning.

Google Version 3.1-flash-lite-preview Kommerzielle Nutzung erlaubt MoE 1000 K Context 01/2026 $0.25 / $1.5 per 1M

  • Proprietär
  • Server
  • API
  • General
  • Multimodal
  • Preview
  • Real-Time

Sovereign Risk: MEDIUM Google ist ein US-amerikanisches Unternehmen und unterliegt dem CLOUD Act, jedoch sind die Modellgewichte nicht öffentlich zugänglich.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
71.28
Routine
43.42
Reasoning
27.87

Rank #53

LLM Judge Avg
3.64
100% Coverage
Avg Task Duration
2.31
Real-Time
Token Rate
235.63
Output Rate
P95 Latency
4.12
Top 5 %
Total Tokens
37.9K
Output Volume
Cost per 1K
$0.0015
USD / 1K Requests
Benchmark Cost
$0.06
Total · 37.9K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Gemini 3.1 Flash Lite Preview Bestes Modell Ø Alle Modelle
Code Quality 67.16
CLI Benchmark 82
Logical Reasoning 77.04
UX Writing 71.27
Documentation 55.08
Content Transform. 77.53
Cultural Intelligence 74.24
Benchmark Cost $0.06

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil