Qwen 3 Coder Next Q4_K_XL

Qwen 3 Coder Next ist ein Coding-spezialisiertes Open-Weights-MoE-Modell von Alibaba mit 80 Milliarden Gesamt- und 3 Milliarden aktiven Parametern. Die Q4-Quantisierung reduziert den Speicherbedarf für lokale Inferenz deutlich, das Kontextfenster umfasst 262.000 Tokens. Unter Apache-2.0-Lizenz auf Workstation-Hardware lokal betreibbar, optimiert für Coding-Agents und grosse Codebasen.

Alibaba Version 3 Coder Next Kommerzielle Nutzung erlaubt MoE 80 B (3 B aktiv) 262 K Context 05/2025 $0 / $0 per 1M

Open Weights
Workstation
SPRK
Text
Instruction-Tuned
Agentic Orchestrator
Interactive

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver: 74.56

Routine: 46.73
Reasoning: 27.84

Rank #23

LLM Judge Avg: 3.67; 100 Coverage

Avg Task Duration: 24.33; ️ Interactive

Token Rate: 49.48; Output Rate

P95 Latency: 65.84; Top 5 %

Total Tokens: 65200; Output Volume

Cost per 1K: $0; USD / 1K Requests

Benchmark Cost: $0; Total · 65200 tok

Benchmark-Module

10 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Qwen 3 Coder Next Q4_K_XL Bestes Modell Ø Alle Modelle

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Qwen 3 Coder Next Q4_K_XL

Schlüsselmetriken

Benchmark-Module

Token-Effizienz & Latenz

Token-Verbrauch pro Modul

Performance-Profil