MiniMax M3

MiniMax M3 ist ein multimodales MoE-Modell (Text, Bild, Video Input; Text Output) mit 1M Token Kontext. Durch die MSA-Architektur (KV-Block Selection) bietet es extrem schnelles Prefill und Decoding. Fokus: Agentische Workflows, Coding und Tool-Use. Chinesisches Modell; Open-Weights ca. 10 Tage nach API-Launch.

MiniMax Version m3 Kommerzielle Nutzung erlaubt MoE 1000 K Context 05/2026 $0.3 / $1.2 per 1M

  • Restricted Weights
  • Frontier
  • OR
  • Vision-Capable
  • Agentic
  • Batch

Sovereign Risk: HIGH MiniMax ist ein chinesisches Unternehmen und unterliegt dem chinesischen National Security Law (NSL), das staatlichen Zugriff auf Daten ermöglichen kann. Das BSI hat im Februar 2025 explizit vor der Nutzung chinesischer KI-Cloud-Dienste gewarnt (BSI-Referenz: Warnung DeepSeek, 04.02.2025); diese Risikoeinschätzung gilt analog für alle chinesischen Cloud-KI-Anbieter, die Nutzerdaten auf chinesischen Servern verarbeiten.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver
77.55
Routine
48.42
Reasoning
29.13

Rank #4

LLM Judge Avg
3.88
100% Coverage
Avg Task Duration
51.76
Batch
Token Rate
19.93
Output Rate
P95 Latency
118.68
Top 5 %
Total Tokens
52.9K
Output Volume
Cost per 1K
$0.0012
USD / 1K Requests
Benchmark Cost
$0.06
Total · 52.9K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

MiniMax M3 Bestes Modell Ø Alle Modelle
Code Quality 81.16
CLI Benchmark 92.46
Logical Reasoning 75.2
UX Writing 70.87
Documentation 72.65
Content Transform. 77.11
Cultural Intelligence 80.86
Benchmark Cost $0.06

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

Token-Verbrauch pro Modul

Performance-Profil