Qwopus 3.6-27B-v2 MTP-Q8_0

Qwopus 3.6-27B-v2 ist ein Open-Weights-Modell auf Basis von Qwen 3.6 27B, trainiert mit Trace Inversion von Claude-Opus-Reasoning-Trajektorien. Die Q8-Quantisierung mit Multi-Token-Prediction bietet einen Geschwindigkeitsvorteil gegenüber dem Basis-Modell bei erhaltener Qualität, das Kontextfenster umfasst 32.000 Tokens. Unter Apache-2.0-Lizenz auf einer einzelnen GPU lokal betreibbar, vollständig kommerziell nutzbar.

Alibaba Version 3.6-MTP (Q8_0 GGUF) Kommerzielle Nutzung erlaubt Dense 27 B (27 B aktiv) 32 K Context 06/2025 $0 / $0 per 1M

  • Open Weights
  • Desktop
  • SPRK
  • Text
  • Instruction-Tuned
  • Unusable

Sovereign Risk: MEDIUM Open-Weights-Modell, basierend auf Qwen3.6-27B (Alibaba, China). Die Fine-Tuning-Daten verwenden Trace Inversion von Claude Opus 4.6/4.7-Reasoning-Trajectories. Da das Modell rein lokal inferiert wird, entfällt CLOUD-Act-Relevanz. Das erhöhte Risiko ergibt sich aus der mehrgliedrigen Community-Modifikationskette (Basis: CN-Jurisdiktion, SFT-Daten aus proprietären Modell-Outputs).

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
73.19
Routine
45.44
Reasoning
27.76

Rank #34

LLM Judge Avg
3.65
100 Coverage
Avg Task Duration
143.93
Unusable
Token Rate
8.42
Output Rate
P95 Latency
319.17
Top 5 %
Total Tokens
110500
Output Volume
Cost per 1K
$0
USD / 1K Requests
Benchmark Cost
$0
Total · 110500 tok

Benchmark-Module

10 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Qwopus 3.6-27B-v2 MTP-Q8_0 Bestes Modell Ø Alle Modelle
Code Quality 73.36
CLI Benchmark 95.33
Logical Reasoning 69.65
UX Writing 71.67
Documentation 75.44
Content Transform. 63.97
Cultural Intelligence 74
Synthesis Quality 49.17
Tool Execution 89.17
ToolUse Score 68.46
Benchmark Cost $0

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil