Qwen 2.5 Coder 7B (llama.cpp, Q6_K)
Qwen 2.5 Coder 7B ist ein kompaktes Open-Weights-Coding-Modell von Alibaba für lokale Ausführung. Die Serie ist auf Code-Generierung, Code-Reparatur und Code-Reasoning ausgelegt und unterstützt lange Kontexte für reale Entwickleraufgaben. In dieser Card läuft es als Q6_K GGUF mit geringerem Speicherbedarf.
- Open Weights
- Edge
- LCL
- Coder
- Real-Time
Sovereign Risk: HIGH Alibaba Cloud (Tongyi Qwen-Team) ist ein chinesisches Unternehmen und unterliegt dem chinesischen National Security Law (NSL). Das BSI hat im Februar 2025 vor chinesischen KI-Cloud-Diensten gewarnt (BSI-Referenz: Warnung DeepSeek, 04.02.2025); bei lokalem Betrieb der Open-Weights-Variante ohne Datenübertragung nach China ist das cloud-spezifische Risikoszenario reduziert.
Schlüsselmetriken
Score · Latenz · Kosten · Qualität
- Total Score Bronze
- 55.8
- Routine
- 33.73
- Reasoning
- 22.07
- LLM Judge Avg
- 2.78 / 5
- 100% Coverage
- Avg Task Duration
- 16.34s
- Real-Time
- Token Rate
- 51.15tok/s
- Output Rate
- P95 Latency
- 29.08s
- Top 5 %
- Total Tokens
- 42.5K
- Output Volume
- Cost per 1K
- $0
- USD / 1K Requests
- Benchmark Cost
- $0
- Total · 42.5K tok
Benchmark-Module
7 Module · gewichtet · vs. Modellmedian & Spitzenreiter
Token-Effizienz & Latenz
Verbrauch pro Modul vs. Modellmedian