Qwen 3.6 35B-A3B Q8_K_XL (GGUF)
Qwen 3.6 35B-A3B ist eine multimodale MoE-Variante von Alibaba, hier als Q8_K_XL GGUF für lokale Nutzung. Das Modell kombiniert 35B Gesamt- mit 3B Aktivparametern, unterstützt langen Kontext und ist auf Text, Bild und Audio ausgerichtet. Die hohe Quantisierung erhält die Qualität weitgehend.
- Open Weights
- Desktop
- LCL
- Thinking-Optional
- Multimodal
- Real-Time
Sovereign Risk: MEDIUM Open-Weights-Modell aus China; Weights sind öffentlich auf Hugging Face verfügbar. Chinesische Herkunft und das nationale Sicherheitsgesetz (NSL) sind bei der Einschätzung des Datenrisikos zu berücksichtigen.
Schlüsselmetriken
Score · Latenz · Kosten · Qualität
- Total Score Silver
- 73.17
- Routine
- 45.39
- Reasoning
- 27.79
- LLM Judge Avg
- 3.74 / 5
- 100% Coverage
- Avg Task Duration
- 17.24s
- Real-Time
- Token Rate
- 63.38tok/s
- Output Rate
- P95 Latency
- 45s
- Top 5 %
- Total Tokens
- 55.1K
- Output Volume
- Cost per 1K
- $0
- USD / 1K Requests
- Benchmark Cost
- $0
- Total · 55.1K tok
Benchmark-Module
7 Module · gewichtet · vs. Modellmedian & Spitzenreiter
Qwen 3.6 35B-A3B Q8_K_XL (GGUF)
Bestes Modell
Ø Alle Modelle
Code Quality
70.64
CLI Benchmark
85
Logical Reasoning
73.25
UX Writing
68.85
Documentation
67.89
Content Transform.
74.9
Cultural Intelligence
77.6
Benchmark Cost
$0
Token-Effizienz & Latenz
Verbrauch pro Modul vs. Modellmedian