Claude Opus 4.6
Claude Opus 4.6 ist Anthropics stärkstes Opus-Modell für komplexe agentische Wissensarbeit, Coding und tiefes Reasoning. Offiziell angekündigt wurden ein 1M-Kontextfenster in Beta, verbesserte Code-Review-, Debugging- und Langhorizont-Fähigkeiten sowie unverändertes Pricing von $5 Input und $25 Output pro 1M Tokens. Das Modell ist proprietär und über Claude, API und große Cloud-Plattformen verfügbar.
- Proprietär
- Frontier
- API
- General
- Agentic-Orchestrator
- Long-Context
- Interactive
Sovereign Risk: MEDIUM Anthropic ist ein US-Anbieter; die Gewichte sind nicht öffentlich und die wesentlichen Risiken betreffen Cloud-Verarbeitung unter US-Recht.
Schlüsselmetriken
Score · Latenz · Kosten · Qualität
- Total Score Silver
- 76.2
- Routine
- 47.29
- Reasoning
- 28.91
- LLM Judge Avg
- 3.79 / 5
- 100% Coverage
- Avg Task Duration
- 28.08s
- ️ Interactive
- Token Rate
- 47.58tok/s
- Output Rate
- P95 Latency
- 76.81s
- Top 5 %
- Total Tokens
- 85.4K
- Output Volume
- Cost per 1K
- $0.025
- USD / 1K Requests
- Benchmark Cost
- $2.14
- Total · 85.4K tok
Benchmark-Module
7 Module · gewichtet · vs. Modellmedian & Spitzenreiter
Claude Opus 4.6
Bestes Modell
Ø Alle Modelle
Code Quality
84.6
CLI Benchmark
85.67
Logical Reasoning
68.76
UX Writing
71.25
Documentation
82.45
Content Transform.
70.35
Cultural Intelligence
76.3
Benchmark Cost
$2.14
Token-Effizienz & Latenz
Verbrauch pro Modul vs. Modellmedian