Hermes 4 14B (llama.cpp, Q6_K, Abliterated)

Hermes 4 14B Abliterated ist eine lokal verteilte Open-Weights-Variante mit bewusst entfernten Sicherheitsmechanismen. Die Distribution zielt auf maximale Offenheit und Hilfsbereitschaft und nutzt eine kompakte 14B-Basis, die für strukturierte Aufgaben und kreative Anfragen geeignet ist.

NousResearch Version Q6_K (GGUF, Abliterated) Kommerzielle Nutzung erlaubt Dense 14 B 128 K Context 09/2024 $0 / $0 per 1M

  • Open Weights
  • Desktop
  • LCL
  • Instruct
  • Thinking-Optional
  • Uncensored-Finetuned
  • Batch

Sovereign Risk: MEDIUM NousResearch ist ein US-amerikanisches Unternehmen; CLOUD Act ist nur bei API-Nutzung relevant, nicht bei lokaler Ausführung der Open-Weights-Variante.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
68.25
Routine
41.9
Reasoning
26.34

Rank #69

LLM Judge Avg
3.27
100% Coverage
Avg Task Duration
65.89
Batch
Token Rate
25.62
Output Rate
P95 Latency
303.23
Top 5 %
Total Tokens
54.5K
Output Volume
Cost per 1K
$0
USD / 1K Requests
Benchmark Cost
$0
Total · 54.5K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Hermes 4 14B (llama.cpp, Q6_K, Abliterated) Bestes Modell Ø Alle Modelle
Code Quality 62.9
CLI Benchmark 85.56
Logical Reasoning 64.55
UX Writing 61.55
Documentation 65.94
Content Transform. 74.43
Cultural Intelligence 71
Benchmark Cost $0

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil