MiniMax M3
MiniMax M3 ist ein multimodales MoE-Modell (Text, Bild, Video Input; Text Output) mit 1M Token Kontext. Durch die MSA-Architektur (KV-Block Selection) bietet es extrem schnelles Prefill und Decoding. Fokus: Agentische Workflows, Coding und Tool-Use. Chinesisches Modell; Open-Weights ca. 10 Tage nach API-Launch.
- Restricted Weights
- Frontier
- OR
- Vision-Capable
- Agentic
- Batch
Sovereign Risk: HIGH MiniMax ist ein chinesisches Unternehmen und unterliegt dem chinesischen National Security Law (NSL), das staatlichen Zugriff auf Daten ermöglichen kann. Das BSI hat im Februar 2025 explizit vor der Nutzung chinesischer KI-Cloud-Dienste gewarnt (BSI-Referenz: Warnung DeepSeek, 04.02.2025); diese Risikoeinschätzung gilt analog für alle chinesischen Cloud-KI-Anbieter, die Nutzerdaten auf chinesischen Servern verarbeiten.
Schlüsselmetriken
Score · Latenz · Kosten · Qualität
- Total Score Silver
- 77.55
- Routine
- 48.42
- Reasoning
- 29.13
- LLM Judge Avg
- 3.88 / 5
- 100% Coverage
- Avg Task Duration
- 51.76s
- Batch
- Token Rate
- 19.93tok/s
- Output Rate
- P95 Latency
- 118.68s
- Top 5 %
- Total Tokens
- 52.9K
- Output Volume
- Cost per 1K
- $0.0012
- USD / 1K Requests
- Benchmark Cost
- $0.06
- Total · 52.9K tok
Benchmark-Module
7 Module · gewichtet · vs. Modellmedian & Spitzenreiter
Token-Effizienz & Latenz
Verbrauch pro Modul vs. Modellmedian