GPT OSS 120B Cloud

GPT-OSS 120B ist ein großes Open-Weights-Modell aus OpenAIs OSS-Linie für Cloud- und lokale Deployments. Die Card positioniert es als offenes Modell mit starkem Generalist- und Reasoning-Profil, das auf hohe Kapazität und flexible Nutzung ausgelegt ist. Es bleibt jedoch deutlich ressourcenintensiv.

OpenAI Version latest Kommerzielle Nutzung erlaubt Dense 120 B 128 K Context 06/2025 $0.15 / $0.6 per 1M

  • Open Weights
  • Frontier
  • CLD
  • Thinking-Optional
  • Agentic
  • Real-Time

Sovereign Risk: LOW Modell von OpenAI (USA), veröffentlicht unter Apache 2.0. Herkunft und Entwickler klar dokumentiert; Weights öffentlich auf HuggingFace verfügbar.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
73.62
Routine
46.05
Reasoning
27.57

Rank #32

LLM Judge Avg
3.77
100% Coverage
Avg Task Duration
11.58
Real-Time
Token Rate
60.26
Output Rate
P95 Latency
28.89
Top 5 %
Total Tokens
52.8K
Output Volume
Cost per 1K
$0.0006
USD / 1K Requests
Benchmark Cost
$0.03
Total · 52.8K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

GPT OSS 120B Cloud Bestes Modell Ø Alle Modelle
Code Quality 76.6
CLI Benchmark 88.89
Logical Reasoning 68.84
UX Writing 65.55
Documentation 70.61
Content Transform. 78.18
Cultural Intelligence 74.3
Benchmark Cost $0.03

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil