Qwen 3 Coder Next Q4_K_XL

Qwen 3 Coder Next ist ein Coding-spezialisiertes Open-Weights-MoE-Modell von Alibaba mit 80 Milliarden Gesamt- und 3 Milliarden aktiven Parametern. Die Q4-Quantisierung reduziert den Speicherbedarf für lokale Inferenz deutlich, das Kontextfenster umfasst 262.000 Tokens. Unter Apache-2.0-Lizenz auf Workstation-Hardware lokal betreibbar, optimiert für Coding-Agents und grosse Codebasen.

Alibaba Version 3 Coder Next Kommerzielle Nutzung erlaubt MoE 80 B (3 B aktiv) 262 K Context 05/2025 $0 / $0 per 1M

  • Open Weights
  • Workstation
  • SPRK
  • Text
  • Instruction-Tuned
  • Agentic Orchestrator
  • Interactive

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
74.56
Routine
46.73
Reasoning
27.84

Rank #23

LLM Judge Avg
3.67
100 Coverage
Avg Task Duration
24.33
️ Interactive
Token Rate
49.48
Output Rate
P95 Latency
65.84
Top 5 %
Total Tokens
65200
Output Volume
Cost per 1K
$0
USD / 1K Requests
Benchmark Cost
$0
Total · 65200 tok

Benchmark-Module

10 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Qwen 3 Coder Next Q4_K_XL Bestes Modell Ø Alle Modelle
Code Quality 79.8
CLI Benchmark 88.89
Logical Reasoning 64.64
UX Writing 71.65
Documentation 68.1
Content Transform. 75.73
Cultural Intelligence 80.3
Synthesis Quality 51.67
Tool Execution 90
ToolUse Score 70.88
Benchmark Cost $0

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil