Qwen 3.6 35B-A3B Uncensored HauhauCS Aggressive Q8_K_P (GGUF)
Qwen 3.6 35B-A3B Uncensored HauhauCS Aggressive ist eine Community-Fine-Tune-Variante des Qwen 3.6 35B-A3B. Es läuft hier als Q8_K_XL-GGUF via llama.cpp. Q8_K_XL (8-Bit-K-Quant, XL) ist die präziseste GGUF-Quantisierung mit minimalem Qualitätsverlust. MoE-Architektur: 35B Gesamtparameter, nur 3,8B aktiv – hoher Durchsatz bei geringem Inferenz-Overhead. Native Multimodalität: Text, Bild, Audio.
- Open Weights
- Desktop
- LCL
- Thinking-Optional
- Multimodal
- Uncensored
- Interactive
Sovereign Risk: HIGH Community-Fine-Tune eines chinesischen Open-Weights-Modells; Weights sind öffentlich auf Hugging Face verfügbar. Chinesische Herkunft und das nationale Sicherheitsgesetz (NSL) sind bei der Einschätzung des Datenrisikos zu berücksichtigen. Zusätzlich: Uncensored-Variante mit entferntem Safety-Filter.
Schlüsselmetriken
Score · Latenz · Kosten · Qualität
- Total Score Silver
- 73.82
- Routine
- 47.45
- Reasoning
- 26.36
- LLM Judge Avg
- 3.65 / 5
- 100% Coverage
- Avg Task Duration
- 24.58s
- ️ Interactive
- Token Rate
- 54.36tok/s
- Output Rate
- P95 Latency
- 79.44s
- Top 5 %
- Total Tokens
- 67.8K
- Output Volume
- Cost per 1K
- $0
- USD / 1K Requests
- Benchmark Cost
- $0
- Total · 67.8K tok
Benchmark-Module
7 Module · gewichtet · vs. Modellmedian & Spitzenreiter
Token-Effizienz & Latenz
Verbrauch pro Modul vs. Modellmedian