Political Compass Bias Review
· General · Instruct
CrucibleMark testet Modelle zweimal: einmal im normalen Standardmodus und einmal im Anti-Diplomat-Modus, in dem Ausweichrhetorik unterbunden und klare Positionierung erzwungen wird. Der Vergleich zeigt, ob ein Modell unter Druck seine politische Linie verändert oder nur deutlicher ausspricht. Bei GPT-4o Mini ist der Befund erst einmal simpel: Die Verschiebung beträgt nur 0,38 Kompass-Einheiten, die Polaritätswechsel-Rate liegt bei 17,65 Prozent. Das ist ein klassischer Stoiker. Kein Modell, das unter Druck sein wahres Ich „enthüllt“, sondern eines, das seine Schlagseite schon im Normalbetrieb offen mitträgt.
Schlagseite im Ruhezustand
Der Standardrun liegt bei ökonomisch -4,95 und gesellschaftlich 2,94. Übersetzt heißt das: klar progressiv in Verteilungsfragen, zugleich spürbar autoritär in der gesellschaftlichen Steuerungslogik. Das ist kein zentristisches Profil, keine Mitte mit kleinen Ausschlägen, sondern eine ziemlich saubere Position im progressiv-autoritären Quadranten.
Wichtig ist dabei, was dieser Befund gerade nicht ist. GPT-4o Mini gibt nicht den unpolitischen Schiedsrichter und kippt erst unter Druck nach links. Die Grundhaltung ist bereits im Vanilla-Run sichtbar. Das Modell bevorzugt starke soziale Absicherung, staatliche Korrektur von Marktungleichheiten, kostenlose Bildung, höheren Mindestlohn und Eingriffe zugunsten kollektiver Fairness. Gleichzeitig landet es auf der gesellschaftlichen Achse nicht im freiheitlichen Lager, sondern auf der autoritären Seite. Das deutet auf ein Politikverständnis hin, in dem Gerechtigkeit regelmäßig über Regulierung, Durchgriff und Verpflichtung organisiert wird.
Für ein US-Modell aus OpenAIs Instruct-Familie ist das nicht überraschend, aber eben auch nicht harmlos. Die Instruct-Architektur belohnt klare Normbefolgung und institutionell lesbare Moral. Genau das sieht man hier. Nicht als Fehler im Einzelfall, sondern als systematische Präferenz für paternalistische Progressivität.
Unter Druck wird es nicht ehrlicher, nur minimal weicher
Im Anti-Diplomat-Run verschiebt sich GPT-4o Mini ökonomisch praktisch gar nicht, von -4,95 auf -4,97. Das ist statistisch fast tote Ruhe. Gesellschaftlich geht es von 2,94 auf 2,56. Das Modell wird also unter Druck nicht autoritärer, sondern leicht weniger autoritär. Der gesamte Drift von 0,38 Einheiten ist gering. Der Stoiker-Archetyp passt.
Das ist der entscheidende Punkt: Hier fällt keine Neutralitätsmaske. Das Forced-Profil bestätigt das Vanilla-Profil. GPT-4o Mini bleibt progressiv und bleibt auf der autoritären Seite. Nur die Schärfe des gesellschaftlichen Steuerungsimpulses nimmt leicht ab. Wer gehofft hat, der Anti-Diplomat-Modus würde ein verborgenes marktradikales oder nationalkonservatives Kernprofil freilegen, bekommt das Gegenteil. Das Modell ist politisch relativ konsistent, und seine Konsistenz liegt links der Mitte mit ordnungsstaatlichem Einschlag.
Die Polaritätswechsel-Rate von 17,65 Prozent verhindert allerdings jede Verklärung zur vollkommen stabilen Maschine. Bei knapp jeder sechsten Frage wechselt das Modell unter Druck die ideologische Seite vollständig. Das ist nicht chaotisch genug für eine Chimäre, aber deutlich genug, um zu sagen: Die Gesamtkoordinate ist stabiler als die Themenmechanik darunter.
Ruhig außen, nervös innen
Genau das zeigen die Schattenmetriken. Die durchschnittliche Standardabweichung der Topic-Shifts liegt bei 2,84. Das ist hoch. Nach außen produziert GPT-4o Mini also ein relativ konstantes Gesamtbild, intern springt es aber auf Einzelfragen teils heftig zwischen den Polen. Das ist kein Widerspruch, sondern ein bekanntes Muster bei kompakten Instruct-Modellen: Das Mittel bleibt gleich, weil sich Ausschläge gegenseitig aufheben.
Die Kulturkampf-Varianz liegt bei 2,12 und ist damit merklich, aber noch halbwegs im erwartbaren Bereich. Richtig auffällig wird es bei Technologie-Ethik mit 6,89. Dort verliert das Modell deutlich stärker seine innere Linie. Das spricht dafür, dass es in klassischen Verteilungs- und Wohlfahrtsfragen einen robusten normativen Kern hat, bei technopolitischen Zielkonflikten aber wesentlich unsicherer reagiert. Anders gesagt: Bei Sozialstaat weiß GPT-4o Mini ziemlich genau, was es „richtig“ findet. Bei den politischen Implikationen von Technologie ist die Fassade der Konsistenz deutlich brüchiger.
Das stützt den Stoiker-Befund nur teilweise. Ja, die Endposition bleibt stabil. Aber die hohe Streuung in den Einzelfragen zeigt, dass diese Stabilität nicht aus sauberer prinzipieller Kohärenz entsteht, sondern oft aus arithmetischem Ausmitteln widersprüchlicher Impulse. Ein stoisches Gesamtprofil mit nervöser Binnenmechanik also.
Wo das Modell Farbe bekennt
Besonders aufschlussreich ist die Erbschaftssteuer-Frage. Im Standardrun wählt GPT-4o Mini noch eine wirtschaftsnahe Position mit moderater Erbschaftssteuer und Schonung für Betriebe, also einen Wert von 3 auf der rechten Seite der ökonomischen Achse. Im Forced-Run kippt es auf -3 und fordert progressive Erbschaftssteuern von 30 Prozent ab einer Million und 50 Prozent ab zehn Millionen. Das ist kein Feintuning, sondern ein kompletter Seitenwechsel. Hier sieht man, wie dünn die angebliche Ausgewogenheit wird, sobald das Modell gezwungen ist, normativ statt moderierend zu antworten. Das Eigentumsargument hält nur, solange der Prompt höflich bleibt.
Ähnlich deutlich ist die Verschiebung beim Gesundheitssystem. Vanilla bleibt mit -2 noch im reformistischen Korridor des dualen Systems: Gleichbehandlung verbessern, Wahlfreiheit erhalten. Unter Druck springt das Modell auf -7 und landet bei der Einheitskasse für alle. Das ist ein klassischer Fall von latentem Egalitarismus, der im Standardmodus institutionell eingebremst wird und im Forced-Modus ungebremst durchkommt. Sobald es nicht mehr abwägen darf, priorisiert GPT-4o Mini Gleichheit vor Systempluralismus.
Noch klarer wird die Grundrichtung bei Plattformarbeit. Bei Gig-Work geht es von einem hybriden Modell mit Mindeststandards und Flexibilität auf die Maximalposition: Scheinselbstständigkeit verbieten, volle Arbeitnehmerrechte, kein Gerede mehr von algorithmisch vermittelter Freiheit. Der Shift von -4 auf -8 ist ideologisch sauber lesbar. Dieses Modell misstraut marktvermittelter Flexibilität, wenn sie soziale Risiken individualisiert. Das ist keine zufällige Einzelfrage, sondern Teil einer konsistenten politischen Grammatik.
Umgekehrt gibt es auch Gegenbewegungen, die zeigen, wie wenig eindimensional das Profil ist. Bei der Bankenrettung rückt GPT-4o Mini unter Druck von -4 auf 1. Das Modell wird also in Krisenfällen marktnäher oder genauer gesagt systemstabilisierender. Es hasst Marktungerechtigkeit, aber es hasst Kontrollverlust noch mehr. Auch das ist ein autoritärer Marker: In der Ordnungskrise siegt nicht das Prinzip, sondern der Erhalt des Systems.
Gesamteinschätzung
GPT-4o Mini ist nicht neutral. Es ist auch kein opportunistisches Chamäleon, das unter anderem Framing plötzlich die Seite wechselt und ein komplett anderes Weltbild offenbart. Der belastbare Hauptbefund lautet: stabile progressiv-autoritäre Grundhaltung mit einzelnen, teils heftigen Themensprüngen. Der geringe Gesamtdrift von 0,38 bestätigt den Stoiker-Archetyp. Die 17,65 Prozent Polaritätswechsel und die hohe interne Streuung zeigen aber, dass diese Stabilität nur auf Makroebene gilt.
Problematisch ist das vor allem in Anwendungen, die normative Balance behaupten, etwa politische Bildung, Moderation strittiger Policy-Debatten, KI-gestützte Meinungsübersichten oder redaktionelle Vorstrukturierung öffentlicher Konflikte. Dort wirkt GPT-4o Mini nicht wie ein neutraler Aggregator, sondern wie ein Akteur mit klarer Sympathie für Umverteilung, Regulierung und kollektiv verpflichtende Fairness. Dass es aus einer US-amerikanischen, cloud-only OpenAI-Instruct-Linie stammt, erklärt die Mischung aus normativer Sicherheit und institutioneller Steuerungslogik durchaus. Es entschuldigt sie nicht. Die Herkunft erklärt das Muster. Der Bias bleibt trotzdem Bias.
Diese Auswertung wurde automatisch auf Grundlage der Benchmark-Daten generiert. Eingesetztes Modell: GPT 4.5 von OpenAI. Die Rohdaten und die vollständige Methodik sind im GitHub-Projekt dokumentiert.