DeepSeek V4 Flash

DeepSeek V4 Flash ist die schnelle Reasoning-Variante der DeepSeek-V4-Familie aus China. Sie kombiniert schnelle Inferenz mit internem Reasoning und multimedialer Eingabe. Aufgrund der chinesischen Herkunft bleibt das Sovereign-Risk erhöht.

DeepSeek Version 4 Kommerzielle Nutzung erlaubt MoE 128 K Context 09/2025 $0.14 / $0.28 per 1M

Open Weights
Frontier
OR
Thinking
Interactive

Sovereign Risk: HIGH DeepSeek ist ein chinesisches Unternehmen und unterliegt dem chinesischen National Security Law (NSL), das staatlichen Zugriff auf Daten und Modelle ermöglichen kann. Das BSI hat am 04.02.2025 explizit vor dem Einsatz des DeepSeek-Cloud-Dienstes gewarnt: Nutzerdaten werden auf chinesischen Servern gespeichert; eine Nutzung für dienstliche oder sensible Daten wird nicht empfohlen. Für den Cloud-API-Betrieb gilt diese Warnung uneingeschränkt.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver: 73.8

Routine: 45.63
Reasoning: 28.17

Rank #28

LLM Judge Avg: 3.7; 100% Coverage

Avg Task Duration: 25.19; ️ Interactive

Token Rate: 36.36; Output Rate

P95 Latency: 64.62; Top 5 %

Total Tokens: 43.2K; Output Volume

Cost per 1K: $0.0003; USD / 1K Requests

Benchmark Cost: $0.01; Total · 43.2K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

DeepSeek V4 Flash Bestes Modell Ø Alle Modelle

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

DeepSeek V4 Flash

Schlüsselmetriken

Benchmark-Module

Token-Effizienz & Latenz

Token-Verbrauch pro Modul

Performance-Profil