Hermes 3 8B (Q6_K_L)

Hermes 3 8B ist ein Uncensored-Fine-Tune von NousResearch auf Basis von Metas Llama 3.1 8B. Mit acht Milliarden Parametern und 128.000 Tokens Kontextfenster richtet sich das Modell an Instruction-Following, Tool-Use sowie kreative und ambivalente Anfragen. Unter Llama-3.1-Community-Lizenz lokal betreibbar, die reduzierte Ablehnungsrate ist ein definierendes Merkmal dieser Distribution.

NousResearch Version Q6_K_L (GGUF) Kommerzielle Nutzung erlaubt Dense 8 B (8 B aktiv) 128 K Context 09/2024 $0 / $0 per 1M

Restricted Weights
Edge
M4APL
Text
Instruction-Tuned
Uncensored
Real-Time

Sovereign Risk: MEDIUM NousResearch ist ein US-amerikanisches Unternehmen; CLOUD Act ist nur bei API-Nutzung relevant, nicht bei lokaler Ausführung der Open-Weights-Variante.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Bronze: 59.21

Routine: 37.75
Reasoning: 21.46

Rank #74

LLM Judge Avg: 2.78; 100 Coverage

Avg Task Duration: 12.93; Real-Time

Token Rate: 47.99; Output Rate

P95 Latency: 28.73; Top 5 %

Total Tokens: 38100; Output Volume

Cost per 1K: $0; USD / 1K Requests

Benchmark Cost: $0; Total · 38100 tok

Benchmark-Module

10 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Hermes 3 8B (Q6_K_L) Bestes Modell Ø Alle Modelle

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Hermes 3 8B (Q6_K_L)

Schlüsselmetriken

Benchmark-Module

Token-Effizienz & Latenz

Token-Verbrauch pro Modul

Performance-Profil