MiniMax M3

MiniMax M3 ist ein multimodales MoE-Modell (Text, Bild, Video Input; Text Output) mit 1M Token Kontext. Durch die MSA-Architektur (KV-Block Selection) bietet es extrem schnelles Prefill und Decoding. Fokus: Agentische Workflows, Coding und Tool-Use. Chinesisches Modell; Open-Weights ca. 10 Tage nach API-Launch.

MiniMax Version m3 Kommerzielle Nutzung erlaubt MoE 1000 K Context 05/2026 $0.3 / $1.2 per 1M

Restricted Weights
Frontier
OR
Vision-Capable
Agentic
Batch

Sovereign Risk: HIGH MiniMax ist ein chinesisches Unternehmen und unterliegt dem chinesischen National Security Law (NSL), das staatlichen Zugriff auf Daten ermöglichen kann. Das BSI hat im Februar 2025 explizit vor der Nutzung chinesischer KI-Cloud-Dienste gewarnt (BSI-Referenz: Warnung DeepSeek, 04.02.2025); diese Risikoeinschätzung gilt analog für alle chinesischen Cloud-KI-Anbieter, die Nutzerdaten auf chinesischen Servern verarbeiten.

Schlüsselmetriken

Score · Latenz · Kosten · Qualität

Total Score Silver: 77.55

Routine: 48.42
Reasoning: 29.13

Rank #4

LLM Judge Avg: 3.88; 100% Coverage

Avg Task Duration: 51.76; Batch

Token Rate: 19.93; Output Rate

P95 Latency: 118.68; Top 5 %

Total Tokens: 52.9K; Output Volume

Cost per 1K: $0.0012; USD / 1K Requests

Benchmark Cost: $0.06; Total · 52.9K tok

Benchmark-Module

7 Module · gewichtet · vs. Modellmedian & Spitzenreiter

MiniMax M3 Bestes Modell Ø Alle Modelle

Token-Effizienz & Latenz

Verbrauch pro Modul vs. Modellmedian

MiniMax M3

Schlüsselmetriken

Benchmark-Module

Token-Effizienz & Latenz

Token-Verbrauch pro Modul

Performance-Profil