KI-Modelle im Vergleich 7 Einsatzszenarien · Gleiche Bedingungen · Proprietär, Restricted Weights & Open Weights
Anbieter suchen sich ihre Benchmarks selbst aus. CrucibleMark nicht. Die Ausgangsfrage war einfach: Wie gut schlagen sich freie Open-Weight-Modelle gegen proprietäre API-Modelle und lizenzlich eingeschränkte Restricted-Weight-Modelle? Hier treten alle nebeneinander an, bewertet an denselben Aufgaben, unter denselben Bedingungen.
Die Stärke des Scoreboards liegt in der Vergleichbarkeit. Wer nach Größenklasse oder Modelltyp filtert, blendet nichts aus. Nicht passende Einträge werden visuell zurückgenommen, bleiben aber im Kontext. So lässt sich direkt ablesen, wo ein Open-Weight-Desktopmodell gegenüber einem proprietären Frontier-Modell steht, und ob der Leistungsunterschied den Preisunterschied rechtfertigt.
Im Scoreboard treten drei Lizenzmodelle gegeneinander an. Proprietäre Modelle geben weder Trainingsdaten heraus noch werden Gewichte veröffentlicht, der Zugang läuft ausschließlich über die API des Herstellers. Restricted-Weight-Modelle veröffentlichen ihre Gewichte und lassen sich lokal oder in der Cloud betreiben, allerdings schränkt die Lizenz die Nutzung meist auf akademische oder nicht-kommerzielle Zwecke ein. Open-Weight-Modelle stehen ohne Auflagen bereit: herunterladen, selbst betreiben, kommerziell einsetzen.
| # | Modell | Total Score | Type | Tool | Speed | Cost | Report |
|---|---|---|---|---|---|---|---|
| Lade Daten… | |||||||