Qwen 3 Coder Next Q4_K_XL (GGUF)
Qwen 3 Coder Next ist hier als Q4_K_XL GGUF für lokale Ausführung verpackt. Das Modell ist auf Coding-Agents, Tool Use und große Codebasen optimiert und nutzt ein 256K-Kontextfenster. Die Q4-Quantisierung senkt den Speicherbedarf stark, bringt aber mehr Qualitätsverlust als die höherpräzisen Varianten.
- Open Weights
- Workstation
- LCL
- Coder
- Agentic
- Interactive
Sovereign Risk: MEDIUM Open-Weights-Modell aus China; Weights sind öffentlich auf Hugging Face verfügbar. Chinesische Herkunft und das nationale Sicherheitsgesetz (NSL) sind bei der Einschätzung des Datenrisikos zu berücksichtigen.
Schlüsselmetriken
Score · Latenz · Kosten · Qualität
- Total Score Silver
- 74.59
- Routine
- 47.39
- Reasoning
- 27.2
- LLM Judge Avg
- 3.69 / 5
- 100% Coverage
- Avg Task Duration
- 23.85s
- ️ Interactive
- Token Rate
- 48.7tok/s
- Output Rate
- P95 Latency
- 65.84s
- Top 5 %
- Total Tokens
- 64.0K
- Output Volume
- Cost per 1K
- $0
- USD / 1K Requests
- Benchmark Cost
- $0
- Total · 64.0K tok
Benchmark-Module
7 Module · gewichtet · vs. Modellmedian & Spitzenreiter
Qwen 3 Coder Next Q4_K_XL (GGUF)
Bestes Modell
Ø Alle Modelle
Code Quality
79.8
CLI Benchmark
88.89
Logical Reasoning
63.85
UX Writing
71.65
Documentation
68.1
Content Transform.
75.73
Cultural Intelligence
80.3
Benchmark Cost
$0
Token-Effizienz & Latenz
Verbrauch pro Modul vs. Modellmedian