GPT OSS 20B Cloud

GPT OSS 20B ist OpenAIs kleineres Open-Weights-Modell (Apache-2.0-Lizenz) mit Mixture-of-Experts-Architektur. Es lässt sich lokal betreiben und ist über verschiedene Cloud-Provider verfügbar. Die Reasoning-Intensität ist konfigurierbar – eine gute Wahl für lokale Deployments und Szenarien, die Fine-Tuning oder vollständige Datenkontrolle erfordern.

OpenAI Version latest Kommerzielle Nutzung erlaubt Dense 20 B 128 K Context 06/2025 $0.075 / $0.3 per 1M

  • Open Weights
  • Workstation
  • CLD
  • Thinking-Optional
  • Agentic
  • Real-Time

Sovereign Risk: LOW Modell von OpenAI (USA), veröffentlicht unter Apache 2.0. Herkunft und Entwickler klar dokumentiert; Weights öffentlich auf HuggingFace verfügbar.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
67.46
Routine
40.14
Reasoning
27.33

Rank #73

LLM Judge Avg
3.36
100% Coverage
Avg Task Duration
7.35
Real-Time
Token Rate
84.76
Output Rate
P95 Latency
22.83
Top 5 %
Total Tokens
39.5K
Output Volume
Cost per 1K
$0.0003
USD / 1K Requests
Benchmark Cost
$0.01
Total · 39.5K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

GPT OSS 20B Cloud Bestes Modell Ø Alle Modelle
Code Quality 75.25
CLI Benchmark 81.12
Logical Reasoning 64
UX Writing 60.25
Documentation 67.75
Content Transform. 62.96
Cultural Intelligence 68.3
Benchmark Cost $0.01

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil