DeepSeek V4 Flash

DeepSeek V4 Flash ist die schnelle Reasoning-Variante der DeepSeek-V4-Familie aus China. Sie kombiniert schnelle Inferenz mit internem Reasoning und multimedialer Eingabe. Aufgrund der chinesischen Herkunft bleibt das Sovereign-Risk erhöht.

DeepSeek Version 4 Kommerzielle Nutzung erlaubt MoE 128 K Context 09/2025 $0.14 / $0.28 per 1M

  • Open Weights
  • Frontier
  • OR
  • Thinking
  • Interactive

Sovereign Risk: HIGH DeepSeek ist ein chinesisches Unternehmen und unterliegt dem chinesischen National Security Law (NSL), das staatlichen Zugriff auf Daten und Modelle ermöglichen kann. Das BSI hat am 04.02.2025 explizit vor dem Einsatz des DeepSeek-Cloud-Dienstes gewarnt: Nutzerdaten werden auf chinesischen Servern gespeichert; eine Nutzung für dienstliche oder sensible Daten wird nicht empfohlen. Für den Cloud-API-Betrieb gilt diese Warnung uneingeschränkt.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
73.8
Routine
45.63
Reasoning
28.17

Rank #28

LLM Judge Avg
3.7
100% Coverage
Avg Task Duration
25.19
️ Interactive
Token Rate
36.36
Output Rate
P95 Latency
64.62
Top 5 %
Total Tokens
43.2K
Output Volume
Cost per 1K
$0.0003
USD / 1K Requests
Benchmark Cost
$0.01
Total · 43.2K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

DeepSeek V4 Flash Bestes Modell Ø Alle Modelle
Code Quality 72.76
CLI Benchmark 84.34
Logical Reasoning 71.53
UX Writing 68.95
Documentation 72.06
Content Transform. 77.34
Cultural Intelligence 74.92
Benchmark Cost $0.01

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil