Gemma 4 31B

Gemma 4 31B IT ist ein Open-Weights-Modell von Google DeepMind der vierten Generation – ausgelegt auf allgemeine Instruktionsbefolgung und Reasoning. Die Gewichte sind unter der Google Gemma Lizenz öffentlich zugänglich. Dieser Eintrag beschreibt den Cloud-API-Zugang; lokale GGUF-Varianten sind separat verfügbar.

Google Version 31b-cloud Kommerzielle Nutzung erlaubt Dense 31 B 128 K Context 06/2025 $0.14 / $0.4 per 1M

  • Restricted Weights
  • Workstation
  • OR
  • General
  • Instruct
  • Preview
  • Interactive

Sovereign Risk: MEDIUM Google DeepMind ist ein US-amerikanisches Unternehmen und unterliegt dem CLOUD Act, jedoch nicht dem chinesischen NSL. Die Gewichte sind unter der Google Gemma Lizenz öffentlich zugänglich (restricted-weights).

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
73.48
Routine
45.57
Reasoning
27.91

Rank #36

LLM Judge Avg
3.63
100% Coverage
Avg Task Duration
22.29
️ Interactive
Token Rate
42.28
Output Rate
P95 Latency
54.87
Top 5 %
Total Tokens
40.6K
Output Volume
Cost per 1K
$0.0004
USD / 1K Requests
Benchmark Cost
$0.02
Total · 40.6K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Gemma 4 31B Bestes Modell Ø Alle Modelle
Code Quality 74.3
CLI Benchmark 85.56
Logical Reasoning 71.27
UX Writing 66.75
Documentation 70.57
Content Transform. 71.07
Cultural Intelligence 80.9
Benchmark Cost $0.02

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil