Qwen 3.5 397B A17B

Qwen 3.5 397B A17B ist Alibabas Flaggschiff-MoE-Modell mit 397 Mrd. Parametern (17 Mrd. aktiviert) und nativer Multimodalität (Text, Bild, Video). Das Modell kombiniert Gated Delta Networks mit Sparse MoE für hocheffiziente Inferenz. Es bietet starke Leistung bei Reasoning, Coding, Agentic Tasks und visuellem Verständnis. Über OpenRouter verfügbar mit ermäßigten Preisen auf Standardtarifen. Chinesische Herkunft und NSL sind bei der Datenrisikoeinschätzung zu berücksichtigen.

Alibaba Version 3.5 Kommerzielle Nutzung erlaubt MoE 397 B 262 K Context 12/2025 $0.39 / $2.34 per 1M

Open Weights
Frontier
OR
Thinking-Optional
General
Multimodal
Long-Context
Interactive

Sovereign Risk: HIGH Alibaba Cloud (Tongyi Qwen-Team) ist ein chinesisches Unternehmen und unterliegt dem chinesischen National Security Law (NSL), das staatlichen Zugriff auf Daten ermöglichen kann. Das BSI hat im Februar 2025 explizit vor der Nutzung chinesischer KI-Cloud-Dienste gewarnt (BSI-Referenz: Warnung DeepSeek, 04.02.2025); diese Risikoeinschätzung gilt analog für alle chinesischen Cloud-KI-Anbieter, die Nutzerdaten auf chinesischen Servern verarbeiten.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver: 72.83

Routine: 44.32
Reasoning: 28.5

Rank #41

LLM Judge Avg: 3.67; 100% Coverage

Avg Task Duration: 43.37; ️ Interactive

Token Rate: 16.49; Output Rate

P95 Latency: 92.15; Top 5 %

Total Tokens: 40.9K; Output Volume

Cost per 1K: $0.0023; USD / 1K Requests

Benchmark Cost: $0.1; Total · 40.9K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Qwen 3.5 397B A17B Bestes Modell Ø Alle Modelle

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Qwen 3.5 397B A17B

Schlüsselmetriken

Benchmark-Module

Token-Effizienz & Latenz

Token-Verbrauch pro Modul

Performance-Profil