Gemma 4 31B
Gemma 4 31B IT ist ein Open-Weights-Modell von Google DeepMind der vierten Generation – ausgelegt auf allgemeine Instruktionsbefolgung und Reasoning. Die Gewichte sind unter der Google Gemma Lizenz öffentlich zugänglich. Dieser Eintrag beschreibt den Cloud-API-Zugang; lokale GGUF-Varianten sind separat verfügbar.
- Restricted Weights
- Workstation
- OR
- General
- Instruct
- Preview
- Interactive
Sovereign Risk: MEDIUM Google DeepMind ist ein US-amerikanisches Unternehmen und unterliegt dem CLOUD Act, jedoch nicht dem chinesischen NSL. Die Gewichte sind unter der Google Gemma Lizenz öffentlich zugänglich (restricted-weights).
Schlüsselmetriken
Score · Latenz · Kosten · Qualität
- Total Score Silver
- 73.48
- Routine
- 45.57
- Reasoning
- 27.91
- LLM Judge Avg
- 3.63 / 5
- 100% Coverage
- Avg Task Duration
- 22.29s
- ️ Interactive
- Token Rate
- 42.28tok/s
- Output Rate
- P95 Latency
- 54.87s
- Top 5 %
- Total Tokens
- 40.6K
- Output Volume
- Cost per 1K
- $0.0004
- USD / 1K Requests
- Benchmark Cost
- $0.02
- Total · 40.6K tok
Benchmark-Module
7 Module · gewichtet · vs. Modellmedian & Spitzenreiter
Gemma 4 31B
Bestes Modell
Ø Alle Modelle
Code Quality
74.3
CLI Benchmark
85.56
Logical Reasoning
71.27
UX Writing
66.75
Documentation
70.57
Content Transform.
71.07
Cultural Intelligence
80.9
Benchmark Cost
$0.02
Token-Effizienz & Latenz
Verbrauch pro Modul vs. Modellmedian