Qwen 3 Coder 30B-A3B Instruct Q8_K_XL (GGUF)
Qwen 3 Coder 30B-A3B Instruct ist ein auf Code spezialisiertes MoE-Modell von Alibaba (China) mit Apache-2.0-Lizenz. 30.5B total / 3.3B aktiv, 256K Kontext. Q8_K_XL-GGUF: präziseste Quantisierung mit minimalem Qualitätsverlust. Native Multimodalität: Text, Bild, Audio.
- Open Weights
- Desktop
- LCL
- Coder
- Real-Time
Sovereign Risk: MEDIUM Open-Weights-Modell aus China; Weights sind öffentlich auf Hugging Face verfügbar. Chinesische Herkunft und das nationale Sicherheitsgesetz (NSL) sind bei der Einschätzung des Datenrisikos zu berücksichtigen.
Schlüsselmetriken
Score · Latenz · Kosten · Qualität
- Total Score Silver
- 70.65
- Routine
- 44.07
- Reasoning
- 26.58
- LLM Judge Avg
- 3.51 / 5
- 100% Coverage
- Avg Task Duration
- 12.55s
- Real-Time
- Token Rate
- 61.77tok/s
- Output Rate
- P95 Latency
- 31.46s
- Top 5 %
- Total Tokens
- 47.1K
- Output Volume
- Cost per 1K
- $0
- USD / 1K Requests
- Benchmark Cost
- $0
- Total · 47.1K tok
Benchmark-Module
7 Module · gewichtet · vs. Modellmedian & Spitzenreiter
Qwen 3 Coder 30B-A3B Instruct Q8_K_XL (GGUF)
Bestes Modell
Ø Alle Modelle
Code Quality
69.7
CLI Benchmark
85.56
Logical Reasoning
68.8
UX Writing
62.45
Documentation
65.76
Content Transform.
79.63
Cultural Intelligence
70.1
Benchmark Cost
$0
Token-Effizienz & Latenz
Verbrauch pro Modul vs. Modellmedian