Hermes 4 14B (Q4_K_M)

Hermes 4 14B als Q4-Quantisierung der NousResearch-Distribution auf Qwen-3-Basis, optimiert für lokale Assistenz und agentische Aufgaben. Mit 14 Milliarden Parametern und 128.000 Tokens Kontextfenster läuft das Modell auf ressourcenbeschränkter Hardware und unterstützt hybride Denkmodi. Unter Apache-2.0-Lizenz voll kommerziell nutzbar.

NousResearch Version 4.0 Kommerzielle Nutzung erlaubt Dense 14 B (14 B aktiv) 128 K Context 09/2024 $0 / $0 per 1M

  • Open Weights
  • Desktop
  • M4APL
  • Text
  • Instruction-Tuned
  • Interactive

Sovereign Risk: MEDIUM NousResearch ist ein US-amerikanisches Unternehmen; CLOUD Act ist nur bei API-Nutzung relevant, nicht bei lokaler Ausführung der Open-Weights-Variante.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
67.34
Routine
42.38
Reasoning
24.96

Rank #64

LLM Judge Avg
3.27
100 Coverage
Avg Task Duration
44.76
️ Interactive
Token Rate
30.3
Output Rate
P95 Latency
139.27
Top 5 %
Total Tokens
63200
Output Volume
Cost per 1K
$0
USD / 1K Requests
Benchmark Cost
$0
Total · 63200 tok

Benchmark-Module

10 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Hermes 4 14B (Q4_K_M) Bestes Modell Ø Alle Modelle
Code Quality 62.5
CLI Benchmark 85.56
Logical Reasoning 64.02
UX Writing 56.65
Documentation 64.83
Content Transform. 73.3
Cultural Intelligence 73.6
Synthesis Quality 45
Tool Execution 90
ToolUse Score 67.21
Benchmark Cost $0

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil