Hermes 3 8B (Q6_K_L)

Hermes 3 8B ist ein Uncensored-Fine-Tune von NousResearch auf Basis von Metas Llama 3.1 8B. Mit acht Milliarden Parametern und 128.000 Tokens Kontextfenster richtet sich das Modell an Instruction-Following, Tool-Use sowie kreative und ambivalente Anfragen. Unter Llama-3.1-Community-Lizenz lokal betreibbar, die reduzierte Ablehnungsrate ist ein definierendes Merkmal dieser Distribution.

NousResearch Version Q6_K_L (GGUF) Kommerzielle Nutzung erlaubt Dense 8 B (8 B aktiv) 128 K Context 09/2024 $0 / $0 per 1M

  • Restricted Weights
  • Edge
  • M4APL
  • Text
  • Instruction-Tuned
  • Uncensored
  • Real-Time

Sovereign Risk: MEDIUM NousResearch ist ein US-amerikanisches Unternehmen; CLOUD Act ist nur bei API-Nutzung relevant, nicht bei lokaler Ausführung der Open-Weights-Variante.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Bronze
59.21
Routine
37.75
Reasoning
21.46

Rank #74

LLM Judge Avg
2.78
100 Coverage
Avg Task Duration
12.93
Real-Time
Token Rate
47.99
Output Rate
P95 Latency
28.73
Top 5 %
Total Tokens
38100
Output Volume
Cost per 1K
$0
USD / 1K Requests
Benchmark Cost
$0
Total · 38100 tok

Benchmark-Module

10 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Hermes 3 8B (Q6_K_L) Bestes Modell Ø Alle Modelle
Code Quality 56.7
CLI Benchmark 80.56
Logical Reasoning 48.82
UX Writing 59.15
Documentation 48.06
Content Transform. 64.24
Cultural Intelligence 67.6
Synthesis Quality 30
Tool Execution 83.33
ToolUse Score 56.38
Benchmark Cost $0

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil