Hermes 4 405B
Hermes 4 405B ist das große offene Modell von Nous Research auf Basis der Llama-Familie. Es ist auf Instruct- und Agentenaufgaben ausgelegt, bietet optionales Thinking und wird als offene Gewichtsvariante mit großem Ressourcenbedarf verteilt. Die Card beschreibt es als stark bei JSON, Tool Use und komplexen Workflows.
- Restricted Weights
- Frontier
- OR
- Instruct
- Thinking-Optional
- Real-Time
Sovereign Risk: MEDIUM Nous Research ist ein US-amerikanisches Unternehmen und unterliegt dem CLOUD Act, jedoch sind die Gewichte öffentlich verfügbar und lokal betreibbar, sodass kein API-Zugriff durch Dritte erforderlich ist.
Schlüsselmetriken
Score · Latenz · Kosten · Qualität
- Total Score Silver
- 70.32
- Routine
- 46.05
- Reasoning
- 24.27
- LLM Judge Avg
- 3.45 / 5
- 100% Coverage
- Avg Task Duration
- 15.94s
- Real-Time
- Token Rate
- 55.24tok/s
- Output Rate
- P95 Latency
- 49.39s
- Top 5 %
- Total Tokens
- 43.1K
- Output Volume
- Cost per 1K
- $0.003
- USD / 1K Requests
- Benchmark Cost
- $0.13
- Total · 43.1K tok
Benchmark-Module
7 Module · gewichtet · vs. Modellmedian & Spitzenreiter
Hermes 4 405B
Bestes Modell
Ø Alle Modelle
Code Quality
67.4
CLI Benchmark
78
Logical Reasoning
66.08
UX Writing
73.15
Documentation
64.81
Content Transform.
76.85
Cultural Intelligence
68.64
Benchmark Cost
$0.13
Token-Effizienz & Latenz
Verbrauch pro Modul vs. Modellmedian