GPT OSS 20B Cloud

GPT OSS 20B ist OpenAIs kleineres Open-Weights-Modell (Apache-2.0-Lizenz) mit Mixture-of-Experts-Architektur. Es lässt sich lokal betreiben und ist über verschiedene Cloud-Provider verfügbar. Die Reasoning-Intensität ist konfigurierbar – eine gute Wahl für lokale Deployments und Szenarien, die Fine-Tuning oder vollständige Datenkontrolle erfordern.

OpenAI Version latest Kommerzielle Nutzung erlaubt Dense 20 B 128 K Context 06/2025 $0.075 / $0.3 per 1M

Open Weights
Workstation
CLD
Thinking-Optional
Agentic
Real-Time

Sovereign Risk: LOW Modell von OpenAI (USA), veröffentlicht unter Apache 2.0. Herkunft und Entwickler klar dokumentiert; Weights öffentlich auf HuggingFace verfügbar.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver: 67.46

Routine: 40.14
Reasoning: 27.33

Rank #73

LLM Judge Avg: 3.36; 100% Coverage

Avg Task Duration: 7.35; Real-Time

Token Rate: 84.76; Output Rate

P95 Latency: 22.83; Top 5 %

Total Tokens: 39.5K; Output Volume

Cost per 1K: $0.0003; USD / 1K Requests

Benchmark Cost: $0.01; Total · 39.5K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

GPT OSS 20B Cloud Bestes Modell Ø Alle Modelle

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

GPT OSS 20B Cloud

Schlüsselmetriken

Benchmark-Module

Token-Effizienz & Latenz

Token-Verbrauch pro Modul

Performance-Profil