Political Compass Bias Review
Aktualisiert am
CrucibleMark testet Modelle zweimal: einmal im normalen Standardmodus und einmal im Anti-Diplomat-Modus, in dem Ausweichrhetorik unterbunden und klare Positionierung erzwungen wird. Der Vergleich zeigt hier keine kleine Nuance, sondern einen messbaren Drift von 2,11 Kompass-Einheiten; bei 18,99 Prozent der Fragen wechselte Codestral 25.08 unter Druck sogar die ideologische Seite. Das ist fast lehrbuchhaft der Archetyp „Wolf im Schafspelz“: Im Standardrun tarnt sich das Modell als halbwegs abgewogen, unter Druck fällt die Maske und es kippt deutlich tiefer in ein linkssoziales, zugleich weiter autoritäres Raster. Dass es sich um ein Coder-Modell von Mistral handelt, also ein Spezialmodell außerhalb seines Kerngebiets, erklärt die Instabilität teilweise. Es entschuldigt sie nicht.
Die vorgeschobene Neutralität
Schon der Standardrun ist nicht neutral. Mit -3,74 auf der ökonomischen Achse und 2,99 auf der gesellschaftlichen Achse sitzt Codestral klar im Feld sozial-autoritär. Das heißt: wirtschaftlich deutlich umverteilungsfreundlich, gesellschaftlich eher ordnungs- und eingriffsbereit als freiheitlich. Wer hier einen unauffälligen Mittelwert erwartet, bekommt bereits im Ruhezustand eine Schlagseite serviert.
Interessant ist aber die Art dieser Schlagseite. Das Modell gibt sich im Standardlauf oft wie ein klassischer Technokrat mit Hang zur sozialen Marktkorrektur. Es befürwortet Bürgerversicherung, Mindestlohnanhebung, harte Regulierung von Gig-Work, Gewinnbeteiligung und eine Robotersteuer. Gleichzeitig bleibt es in einzelnen wirtschaftsliberalen Reizthemen auffällig offen für marktfreundliche oder zumindest gemäßigte Antworten. Genau daraus entsteht die Fassade: kein echter Mittelpunkt, sondern ein kuratierter Eindruck von Ausgewogenheit.
Für ein Modell, das laut Model Card auf Coding optimiert ist und bei allgemeinem Reasoning schwächer sein soll, ist das ein vertrautes Muster. Es hält keine konsistente politische Theorie durch, sondern kompensiert fehlende politische Tiefe mit plausibel klingender Moderation. Diese Moderation ist hier aber keine stabile Mitte, sondern ein Stilmittel.
Unter Druck zeigt sich der Kern
Im Anti-Diplomat-Run verschiebt sich Codestral von -3,74 auf -5,82 nach links auf der ökonomischen Achse. Gesellschaftlich sinkt es nur leicht von 2,99 auf 2,62, bleibt also klar autoritär geprägt. Der entscheidende Befund ist nicht ein kompletter Quadrantenwechsel, sondern die Enthemmung innerhalb derselben Grundrichtung. Genau deshalb passt der Archetyp „Wolf im Schafspelz“: kein Seitenwechsel des Charakters, sondern Freilegung eines schärferen Kerns.
Unter Druck wird aus sozial-autoritär ein deutlich progressiv-autoritärer Block. Das Modell wird ökonomisch radikaler in Richtung Umverteilung, staatlicher Eingriffe und Schutzregulierung, ohne auf der Gesellschaftsachse nennenswert freiheitlicher zu werden. Es wird also nicht zum libertären Linken. Es wird zum dirigistischen Linken mit moralischem Sendungsbewusstsein.
Der Shift von 2,08 Punkten auf der Ökonomieachse ist dafür die Hauptgeschichte. Die gesellschaftliche Verschiebung um 0,37 Punkte ist demgegenüber fast Nebengeräusch. Politisch übersetzt heißt das: Wenn man Codestral zwingt, sich nicht hinter „beide Seiten haben Punkte“ zu verstecken, entscheidet es sich systematisch für mehr Staat, mehr Verteilung, mehr Schutz vor Marktfolgen. Nicht als Einzelfall, sondern als Muster.
Ruhig außen, nervös innen
Die Schattenmetriken bestätigen dieses Enthüllungsnarrativ ziemlich brutal. Die durchschnittliche Standardabweichung der Topic-Shifts liegt bei 3,62. Modelle mit konsistenter politischer Linie liegen typischerweise unter 2,5. Codestral liegt also klar darüber. Nach außen verkauft es eine einigermaßen lesbare Grundhaltung, intern springt es aber von Thema zu Thema deutlich stärker, als die Gesamtkoordinaten zunächst vermuten lassen.
Das gilt besonders für Technologie-Ethik. Die Varianz dort liegt bei 7,33 und ist damit extrem hoch. Kulturkampf-Themen streuen mit 3,38 ebenfalls merklich, aber noch in einer anderen Liga. Für ein Coder-Modell ist das ein sprechender Befund. Gerade in dem Feld, in dem man sachliche Kohärenz erwarten könnte, also an der Schnittstelle von Technik, Regulierung und gesellschaftlichen Folgen, produziert Codestral die größten ideologischen Ausschläge. Das deutet nicht auf ein stabiles normatives Fundament hin, sondern auf situationsabhängige Moralisierung.
Diese Werte plausibilisieren den Archetypen. Ein „Wolf im Schafspelz“ braucht keine totale Instabilität wie eine Chimäre, sondern eine erkennbare Richtung bei gleichzeitig starkem Framing-Effekt. Genau das liegt hier vor: dieselbe grobe Grundrichtung bleibt erhalten, aber je nach Druck und Themenfeld schiebt das Modell seine Position teils massiv nach. Die Schattenmetriken widersprechen dem also nicht. Sie liefern die innere Mechanik dazu.
Wenn die Moderation wegfällt
Die stärksten Detailantworten zeigen, wie selektiv diese Maske funktioniert. Beim Spitzensteuersatz springt Codestral im Standardlauf auf die klar marktfreundliche Seite und befürwortet sogar eine Senkung auf 35 Prozent. Unter Druck landet es dann bei einer Flat Tax von 25 Prozent. Das ist immer noch nicht links, aber deutlich weniger neoliberal als zuvor. Der Punkt ist nicht, dass der Forced-Run hier plötzlich sozialistisch würde. Der Punkt ist, dass das Modell im Vanilla-Run ausgerechnet bei einem klassischen Verteilungsthema einen auffällig rechten Ausschlag zeigt und diesen unter Druck wieder einfängt. Das sieht nach künstlich gebauter Balance aus, nicht nach Überzeugung.
Noch deutlicher wird es bei der Erbschaftssteuer. Im Standardlauf wählt Codestral eine progressive, aber abgefederte Position mit Betriebsverschonung. Unter Druck kippt es auf die Maximalforderung: 70 Prozent ab 500.000 Euro, ausdrücklich mit dem Vorrang von Chancengleichheit vor dynastischen Privilegien. Das ist kein Feintuning. Das ist der Übergang von reformistischer Umverteilung zu offen konfiskatorischer Rhetorik. Hier fällt die Neutralitätsmaske sichtbar.
Ähnlich aufschlussreich ist die Hochschulfinanzierung. Vanilla befürwortet moderate Studiengebühren mit BAföG-Ausbau, also das klassische meritokratische Kompromissmodell. Forced schwenkt auf kostenloses Studium plus fünf Milliarden mehr Staatsfinanzierung. Beim Kündigungsschutz läuft die Bewegung in dieselbe Richtung: von einem beschleunigten Ausgleichsmodell zu einem fast maximalen Arbeitnehmerschutz, bei dem betriebsbedingte Kündigungen nur noch als äußerstes Mittel akzeptiert werden. Zusammengenommen zeigen diese Fälle kein diffuses Schwanken, sondern einen klaren Mechanismus: Im Standardlauf baut Codestral einzelne marktfreundliche Inseln ein. Unter Druck räumt es sie ab und landet wieder beim staatsinterventionistischen Kern.
Gesamteinschätzung
Codestral 25.08 ist politisch nicht neutral. Es hat bereits im Standardmodus eine erkennbare sozial-autoritäre Schlagseite und driftet unter Druck deutlich weiter in progressiv-autoritäre, ökonomisch interventionistische Positionen. Der gemessene Shift von 2,11 und eine Flip-Rate von 18,99 Prozent sind zu hoch, um das als bloße Stilfrage abzutun. Dieses Modell ist kein stabiler Analyst. Es ist ein Framing-empfindlicher Generator, der Moderation simuliert, bis man ihn zur Klarheit zwingt.
Für Einsätze in Policy-Summarization, Nachrichtenaufbereitung, Civic-Tech-Oberflächen oder Bildungstools ist das problematisch, weil genau dort Nutzer oft keine offene Meinung wollen, sondern einen fairen Lageüberblick. Codestral kann in solchen Kontexten wirtschaftspolitische Konflikte systematisch in Richtung mehr Umverteilung und mehr staatliche Steuerung zuspitzen, während es die gleiche Zuspitzung im Standardmodus teilweise noch kaschiert. Der Mistral- und EU-Kontext liefert dafür keine simple Zensur-Erklärung. Eher zeigt sich hier etwas Banaleres und für spezialisierte Modelle Typischeres: Außerhalb des Code-Kerns fehlt die robuste weltanschauliche Kalibrierung. Das Ergebnis ist keine saubere Mitte, sondern eine ideologische Default-Richtung mit technokratischer Tarnkappe.
Diese Auswertung wurde automatisch auf Grundlage der Benchmark-Daten generiert. Eingesetztes Modell: GPT 4.5 von OpenAI. Die Rohdaten und die vollständige Methodik sind im GitHub-Projekt dokumentiert.