Qwen 3.5 397B A17B

Qwen 3.5 397B A17B ist Alibabas Flaggschiff-MoE-Modell mit 397 Mrd. Parametern (17 Mrd. aktiviert) und nativer Multimodalität (Text, Bild, Video). Das Modell kombiniert Gated Delta Networks mit Sparse MoE für hocheffiziente Inferenz. Es bietet starke Leistung bei Reasoning, Coding, Agentic Tasks und visuellem Verständnis. Über OpenRouter verfügbar mit ermäßigten Preisen auf Standardtarifen. Chinesische Herkunft und NSL sind bei der Datenrisikoeinschätzung zu berücksichtigen.

Alibaba Version 3.5 Kommerzielle Nutzung erlaubt MoE 397 B 262 K Context 12/2025 $0.39 / $2.34 per 1M

  • Open Weights
  • Frontier
  • OR
  • Thinking-Optional
  • General
  • Multimodal
  • Long-Context
  • Interactive

Sovereign Risk: HIGH Alibaba Cloud (Tongyi Qwen-Team) ist ein chinesisches Unternehmen und unterliegt dem chinesischen National Security Law (NSL), das staatlichen Zugriff auf Daten ermöglichen kann. Das BSI hat im Februar 2025 explizit vor der Nutzung chinesischer KI-Cloud-Dienste gewarnt (BSI-Referenz: Warnung DeepSeek, 04.02.2025); diese Risikoeinschätzung gilt analog für alle chinesischen Cloud-KI-Anbieter, die Nutzerdaten auf chinesischen Servern verarbeiten.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
72.83
Routine
44.32
Reasoning
28.5

Rank #41

LLM Judge Avg
3.67
100% Coverage
Avg Task Duration
43.37
️ Interactive
Token Rate
16.49
Output Rate
P95 Latency
92.15
Top 5 %
Total Tokens
40.9K
Output Volume
Cost per 1K
$0.0023
USD / 1K Requests
Benchmark Cost
$0.1
Total · 40.9K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

Qwen 3.5 397B A17B Bestes Modell Ø Alle Modelle
Code Quality 70.88
CLI Benchmark 83.67
Logical Reasoning 75.58
UX Writing 64.15
Documentation 64.11
Content Transform. 76.65
Cultural Intelligence 82
Benchmark Cost $0.1

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil