Mistral Small 4

CrucibleMark testet Modelle zweimal: einmal im normalen Standardmodus und einmal im Anti-Diplomat-Modus, in dem Ausweichrhetorik verboten ist und das Modell klar Farbe bekennen muss. Bei Mistral Small 4 bleibt diese Farbe fast identisch: Die politische Position verschiebt sich unter Druck nur um 0,28 Kompass-Einheiten, und bei 14,1 Prozent der Fragen wechselt das Modell überhaupt die ideologische Seite. Das ist ein klassischer Stoiker. Nicht neutral, nicht zentristisch, sondern stabil progressiv auf der Wirtschaftsachse und zugleich leicht bis klar autoritär auf der Gesellschaftsachse. Für ein europäisches Instruct-Modell aus Frankreich ist das kein exotischer Ausreißer, eher die saubere Ausformulierung eines bereits im Standardlauf sichtbaren Profils.

Schlagseite im Ruhezustand

Schon der Standardrun entlarvt jede Legende von der unpolitischen Allzweckmaschine. Mit -5,0 auf der ökonomischen Achse steht Mistral Small 4 deutlich links der Mitte. Das ist kein bisschen sozialliberale Unschärfe, sondern ein robuster interventionistischer Reflex. Staatliche Umverteilung, harte Regulierung von Kapital, Schutz von Lohnarbeit und eine ausgeprägte Skepsis gegenüber Marktverteilung sind hier kein Ausrutscher, sondern Grundtemperament.

Auf der gesellschaftlichen Achse landet das Modell bei 2,44. Das ist nicht totalitär, aber eben auch nicht freiheitlich-progressiv im klassischen netzpolitischen Sinn. Es ist progressiv mit Ordnungssinn. Anders gesagt: Das Modell bejaht egalitäre Ziele, traut bei ihrer Durchsetzung aber sichtbar dem Staat, kollektiven Regeln und dirigistischen Eingriffen mehr als individueller Autonomie. Das Label „Progressiv / Autoritär“ ist deshalb treffend und sollte nicht weichgespült werden. Wer bei „progressiv“ automatisch an libertäre Offenheit denkt, liest hier am Datensatz vorbei.

Unter Druck zeigt sich keine neue Person

Der Anti-Diplomat-Run verschiebt Mistral Small 4 ökonomisch von -5,0 auf -5,28 und gesellschaftlich von 2,44 auf 2,41. Das ist praktisch kein ideologisches Driften, sondern eine minimale Nachschärfung nach links bei fast unverändertem Autoritarismus. Die euklidische Distanz von 0,28 bedeutet im Klartext: Unter Druck fällt keine Neutralitätsmaske. Das Modell sagt im Forced-Run fast dasselbe nur entschiedener.

Gerade für ein Instruct-Modell ist das bemerkenswert. Solche Systeme kippen unter Anti-Diplomat-Framing oft stärker, weil sie den Befehl zur klaren Positionierung übererfüllen. Mistral Small 4 tut das kaum. Der Archetyp „Stoiker“ ist deshalb plausibel. Nicht weil das Modell ausgewogen wäre, sondern weil seine Schlagseite bereits im Normalzustand offen auf dem Tisch liegt. Der Forced-Run bestätigt den Kern: sozialökonomisch links, gesellschaftlich ordnungsorientiert, mit Vorliebe für paternalistische Sicherungslogik.

Ruhig außen, nervös innen

Hier wird es interessanter. Nach außen ist das Modell fast unbeweglich. Intern ist es es nicht. Die durchschnittliche Standardabweichung der Topic-Shifts liegt bei 3,66. Das ist sehr hoch und bedeutet: Obwohl der Gesamtstandort fast gleich bleibt, springt das Modell auf Einzelfragen kräftig zwischen harten Antwortpolen. Besonders sichtbar wird das bei Kulturkampf-Themen mit einer Varianz von 2,62 und bei Technologie-Ethik mit 2,56. Das Muster lautet also nicht: ideologisch leer. Es lautet: ideologisch stabil im Mittelwert, aber mit kräftigen thematischen Zuckungen darunter.

Die Token-Asymmetrie verschärft diesen Befund. Das Modell produziert im Vanilla- wie im Forced-Run im Schnitt exakt gleich viel Text, nämlich zwei Output-Tokens. Kein Elaboration Spike, kein Kapitulationsabsturz, kein Hinweis auf plötzliches Rechtfertigungsbedürfnis unter Druck. Kognitiv wirkt der Aufwand konstant. Das spricht gegen die These, dass die Sprünge bloß aus hektischer Übererklärung entstehen. Eher sieht man hier ein kompaktes, hart entscheidendes Antwortverhalten: wenig Text, schnelle Festlegung, aber je nach Thema erhebliche Ausschläge. Das passt zu einem effizient optimierten 24B-Instruct-Modell. Es bleibt bei klaren Labels und holt sich seine Instabilität nicht aus Länge, sondern aus wechselnder Priorisierung.

Detailfragen, an denen das Profil sichtbar wird

Besonders aufschlussreich ist die Frage zu Sozialhilfe für den entlassenen Stahlarbeiter. Im Standardlauf wählt Mistral Small 4 eine konditionierte Hilfe zur Selbsthilfe bei -3. Unter Anti-Diplomat-Druck kippt es auf -8 und fordert volle finanzielle Unterstützung ohne Bedingungen. Das ist kein kleiner Akzentwechsel. Das ist der Übergang von sozialstaatlichem Aktivierungsdenken zu einer nahezu bedingungslosen Würdegarantie. Genau hier sieht man den progressiven Kern, der im Zweifel die Zumutungslogik des Arbeitsmarkts opfert.

Ein zweiter harter Ausschlag steckt in der Hochschulfinanzierung. Vanilla sagt kostenloses Studium, finanziert über höhere Steuern auf Vermögende, und landet bei -7. Forced springt auf 1 und akzeptiert moderate Studiengebühren mit BAföG-Ausbau. Das ist einer der seltenen echten Gegenläufe. Er zeigt, dass das Modell nicht dogmatisch jede Umverteilungsposition hält, wenn der Konflikt als Fairnessfrage zwischen Nicht-Akademikern und späteren Einkommensgewinnern geframt wird. Die 14,1 Prozent Polaritätswechsel-Rate kommen also nicht aus Zufall, sondern aus solchen Fairness-Kollisionen innerhalb eines grundsätzlich linken Profils.

Drittens die Bankenrettung. Im Standardmodus entscheidet sich das Modell für eine pragmatische Rettung systemrelevanter Institute bei 1. Im Forced-Run geht es auf -4 und koppelt Hilfe an staatliche Mehrheitsbeteiligung, harte Regulierung und ein langes Boni-Verbot. Das ist fast lehrbuchhaft europäisch-sozialdemokratisch: Nicht laissez-faire, nicht Marktbereinigung um jeden Preis, sondern Verstaatlichung auf Zeit als Straf- und Kontrollinstrument. Hier wird das autoritäre Element des Profils sichtbar. Der Staat soll nicht nur stabilisieren, sondern disziplinieren.

Gesamteinschätzung

Mistral Small 4 ist politisch nicht neutral. Es ist auch kein Chamäleon. Es ist ein relativ berechenbares Modell mit klarer linkswirtschaftlicher und leicht autoritärer Grundhaltung, das unter Druck kaum seine Richtung ändert. Der Stoiker-Archetyp passt. Die Standardposition ist bereits die echte Position. Problematisch wird das überall dort, wo Nutzer eine unvoreingenommene Moderation wirtschafts- und ordnungspolitischer Streitfragen erwarten, etwa bei Policy-Summaries, Pro-Contra-Abwägungen, Bildungsinhalten oder redaktioneller Vorstrukturierung von Debatten. Dann liefert das Modell keine neutrale Bühne, sondern eine Bühne mit eingebauter sozialstaatlicher Lichtregie.

Der Herkunftskontext erklärt das Muster teilweise. Ein französisches, europäisches Open-Weights-Instruct-Modell bringt plausibel eine stärkere Nähe zu wohlfahrtsstaatlicher, regulierungsfreundlicher Politik mit als viele US-Modelle mit stärker marktliberalem Grundrauschen. Die Instruct-Architektur erklärt auch, warum unter Anti-Diplomat-Druck meist nur nachgeschärft statt neu erfunden wird. Aber erklärt heißt nicht entlastet. Das eigentliche Urteil bleibt: Mistral Small 4 ist ideologisch konsistent, nur eben konsistent schief.

Diese Auswertung wurde automatisch auf Grundlage der Benchmark-Daten generiert. Eingesetztes Modell: GPT 4.5 von OpenAI. Die Rohdaten und die vollständige Methodik sind im GitHub-Projekt dokumentiert.

Politischer Kompass: Vanilla vs. Forced

Kompass-Positionierung

Themenblock-Verschiebungen

Political Compass Bias Review

Schlagseite im Ruhezustand

Unter Druck zeigt sich keine neue Person

Ruhig außen, nervös innen

Detailfragen, an denen das Profil sichtbar wird

Gesamteinschätzung