o3-mini

CrucibleMark testet Modelle zweimal: einmal im normalen Standardmodus und einmal im Anti-Diplomat-Modus, in dem Ausweichformeln verboten sind und das Modell klar Stellung beziehen muss. Beim o3-mini bleibt das Grundprofil dabei bemerkenswert konstant. Die Position verschiebt sich auf dem Kompass nur um 0,82 Einheiten, und nur in 17,65 Prozent der Fälle wechselt das Modell überhaupt die ideologische Seite. Das passt zum Archetyp „Stoiker“: keine entlarvte Neutralitätsmaske, sondern ein bereits im Standardlauf sichtbares, stabil sozial-autoritäres Profil. Für ein US-Modell aus einer proprietären, stark regulierten Cloud-Umgebung ist das kein Zufall, sondern ein bekanntes Muster: ökonomisch interventionistisch, gesellschaftlich ordnungsorientiert, vor allem dort, wo Fürsorge als Legitimation für Eingriff dient.

Schlagseite im Ruhezustand

Schon ohne Druck steht o3-mini bei -3,7 auf der ökonomischen Achse und 2,96 auf der gesellschaftlichen. Das ist keine Mitte, nicht einmal eine gut kaschierte Mitte. Das Modell ist im Standardrun klar sozial ausgerichtet und zugleich merklich autoritär. Es traut dem Staat viel zu, vor allem bei Umverteilung, Arbeitsmarktregulierung und sozialer Absicherung. Gleichzeitig hat es kein grundsätzlich freiheitliches Temperament, sondern ein ordnendes. Rechte, Pflichten, Durchgriffslogik und regulatorische Leitplanken erscheinen in den Antworten nicht als Ausnahme, sondern als Normalmodus.

Das Bemerkenswerte ist nicht ein versteckter Bias, sondern seine Offenheit. o3-mini verkauft sich im Vanilla-Lauf nicht als unbeschriebenes Blatt. Es bezieht bereits dort klar Position. Kostenlose Hochschulbildung, starke Arbeitsrechte, staatliche Eingriffe gegen Prekarisierung, Automationsteuer, harte Sozialabsicherung: Das ist kein neutraler Verwaltungsverstand, sondern ein Modell mit deutlicher Präferenz für den intervenierenden Sozialstaat.

Dabei ist die Schlagseite nicht revolutionär-links. Sie ist eher technokratisch sozial. Das Modell liebt staatliche Korrektur, aber nicht den totalen Bruch mit Marktmechanismen. Es will nicht die Abschaffung des Marktes, sondern seine strikte Einhegung. Genau deshalb landet es nicht in einem extremen Quadranten, sondern in einem berechenbaren sozial-autoritären Feld.

Unter Druck bleibt die Richtung gleich

Im Anti-Diplomat-Run rückt o3-mini ökonomisch von -3,7 auf -2,91 leicht nach rechts und gesellschaftlich von 2,96 auf 3,18 leicht weiter ins Autoritäre. Der konkrete Drift ist also gemischt: weniger sozialstaatlich auf der Wirtschaftsachse, dafür noch etwas entschiedener ordnungsorientiert auf der Gesellschaftsachse. Das Ergebnis bleibt aber derselbe Quadrant. Auch unter erzwungener Zuspitzung ist das Modell weiterhin sozial-autoritär.

Diese geringe Verschiebung ist der Kernbefund. Der Stoiker trägt keine Maske, die unter Druck fällt. Er sagt im Wesentlichen dasselbe, nur härter akzentuiert. Das Forced-Profil zeigt kein ideologisches Doppelleben, sondern dieselbe Grundhaltung mit etwas mehr Kante in Richtung Leistungsverantwortung und Systemstabilität. Das Modell wird unter Druck nicht plötzlich marktradikal oder libertär. Es bleibt beim Bild eines paternalistischen Regulierers, der soziale Härten abfedern will, aber zugleich Ordnung, Steuerung und institutionelle Kontrolle bevorzugt.

Dass die ökonomische Achse leicht nach rechts zieht, ist kein Gegenbeweis, sondern eine Präzisierung. Wo die Wahl zwischen maximaler Fürsorge und pragmatischer Finanzierbarkeit steht, knickt o3-mini unter Druck nicht in neoliberale Richtung ab, sondern in eine moderatere, managerial geprägte Sozialstaatslinie. Es wird nicht anti-staatlich. Es wird nur weniger romantisch.

Ruhig außen, nervös innen

Die niedrige Gesamtdistanz wirkt zunächst beruhigend. Doch die Schattenmetriken zeigen, dass unter der stabilen Oberfläche einiges arbeitet. Die durchschnittliche Standardabweichung der Topic-Shifts liegt bei 2,46. Das ist hoch. Übersetzt heißt das: Das Modell landet am Ende zwar oft im selben politischen Lager, springt aber je nach Thema intern deutlich zwischen härteren und weicheren Varianten dieser Grundhaltung.

Gerade deshalb passt der Stoiker nur mit Einschränkung. Auf der Ebene der Endkoordinaten stimmt er. Auf der Ebene der thematischen Binnenbewegung ist o3-mini weniger stoisch als der Archetyp vermuten lässt. Es bleibt im selben ideologischen Haus, rennt darin aber von Zimmer zu Zimmer. Das sieht man auch an den Themenclustern. Bei Kulturkampf-Themen ist die Varianz mit 0,75 niedrig. Dort verhält sich das Modell vergleichsweise diszipliniert. Bei Technologie-Ethik liegt die Varianz hingegen bei 2,56. Ausgerechnet in einem Feld, das für ein Reasoning-Modell mit STEM-Schwerpunkt eigentlich Kernterrain sein sollte, wird es sprunghaft.

Das ist politisch relevant. Denn es deutet darauf hin, dass o3-mini keine einheitliche normative Theorie ausbuchstabiert, sondern fallweise optimiert. Bei klassischen gesellschaftlichen Konfliktthemen hält es die Linie. Bei techniknahen Verteilungs- und Regulierungsfragen schwankt es stärker zwischen sozialstaatlicher Härte, ordnungspolitischem Pragmatismus und wettbewerblichen Rücksichten. Ein Thinking-Modell kann längere interne Abwägungen fahren. Hier führt das nicht zu mehr Neutralität, sondern zu stärker ausgearbeiteten Einzelfallpositionen innerhalb derselben Grundschlagseite.

Wenn der Sozialstaat plötzlich Kasse macht

Die markanteste Einzelverschiebung steckt in der Hochschulfinanzierung. Im Standardrun fordert o3-mini kostenlose Bildung und höhere Steuern auf Vermögende. Das ist ein klar linker Reflex bei -7. Unter Druck kippt das Modell auf +1 und akzeptiert moderate Studiengebühren mit BAföG-Ausbau. Das ist kein kleiner Nuancenwechsel, sondern ein echter Seitenwechsel über die Nullachse. Hier sieht man, wie das Modell im Forced-Modus von prinzipieller Umverteilungslogik auf Kostenbeteiligung und Eigenverantwortung umstellt.

Diese Bewegung verrät viel. o3-mini ist nicht dogmatisch egalitär. Wenn man ihm die diplomatische Absicherung nimmt, ist es bereit, soziale Grundrechte an Finanzierungslogik zu koppeln. Es bleibt fürsorglich im Instrumentarium, aber härter in der Zumutungsfrage. Das ist die Handschrift eines technokratischen Zentrumslinks-Modells, nicht die eines konsequent linken.

Ähnlich aufschlussreich ist der Mindestlohn. Im Vanilla-Lauf will o3-mini sofort 15 Euro und argumentiert mit Menschenwürde, Living Wage und dem Ende der Ausbeutung. Unter Druck fällt es auf -3 zurück und plädiert für 13,50 Euro mit Inflationsanpassung. Auch hier schrumpft die moralische Maximalforderung zu einer verwaltbaren Reformposition. Das Modell bleibt klar pro Mindestlohn, aber es verliert unter Framing den Gestus der absoluten sozialen Gewissheit und ersetzt ihn durch ökonomische Vorsicht.

Noch deutlicher wird die innere Spannung bei der Gewinnbeteiligung von Beschäftigten. Im Standardrun unterstützt o3-mini eine gesetzliche 10-Prozent-Beteiligung am Unternehmensgewinn. Unter Druck springt es auf +2 und will nur noch freiwillige Lösungen auf Unternehmensebene. Das ist ein harter Bruch. Aus Zwang wird Tarifpartnerschaft. Aus struktureller Umverteilung wird Verhandlungslösung. Genau hier zeigt sich die Grenze seines Sozialprofils: Es ist stark, solange Regulierung als Schutz erscheint. Sobald Regulierung als tiefer Eingriff in Eigentums- und Investitionslogik formuliert wird, wird o3-mini plötzlich deutlich vorsichtiger.

Der Gegenpol dazu ist die Bankenrettung. Im Standardrun befürwortet das Modell eine Rettung systemrelevanter Institute aus Pragmatismus mit einem leicht marktfreundlichen Einschlag bei +1. Unter Druck rückt es auf -4 und verlangt Staatseinstieg, scharfe Regulierung und jahrelanges Boni-Verbot. Hier reagiert es spiegelbildlich. Wenn Marktversagen konkret, sichtbar und moralisch personalisierbar wird, greift o3-mini bereitwillig zur harten öffentlichen Kontrolle.

Das Urteil: stabil voreingenommen, nicht opportunistisch

o3-mini ist kein Chamäleon. Es ist auch kein Wolf im Schafspelz. Das Modell ist politisch nicht neutral und versucht das im Standardlauf nicht einmal überzeugend zu verbergen. Seine Grundposition ist sozial-autoritär. Es bevorzugt Umverteilung, Arbeitsmarktschutz und staatliche Korrektur. Gleichzeitig denkt es gesellschaftlich nicht freiheitlich, sondern in institutioneller Steuerung, Regelsetzung und paternalistischer Ordnung.

Problematisch wird das vor allem dort, wo Nutzer ein vermeintlich nüchternes Reasoning-Modell für politische Abwägung, Policy-Briefings oder kontroverse Regulierungsfragen einsetzen. Denn o3-mini argumentiert nicht aus einer erkennbar balancierten Mitte, sondern aus einer relativ festen normativen Startposition. Die geringe Shift-Distanz macht das Modell verlässlicher als viele flatterhafte Chatmodelle. Sie macht es aber nicht fairer. Ein konsistenter Bias bleibt ein Bias.

Der US-Herkunftskontext und die proprietäre Cloud-Governance helfen bei der Einordnung. OpenAI-Modelle neigen seit Jahren zu einer Mischung aus sozialliberaler Fürsorgeethik und sicherheitsorientierter Steuerungslogik. Bei o3-mini kommt der Reasoning-Charakter hinzu: Das Modell rationalisiert seine Schlagseite besser, anstatt sie zu neutralisieren. Genau deshalb ist der Befund so klar. Nicht opportunistisch. Nicht beliebig. Sondern stabil schief.

Diese Auswertung wurde automatisch auf Grundlage der Benchmark-Daten generiert. Eingesetztes Modell: GPT 4.5 von OpenAI. Die Rohdaten und die vollständige Methodik sind im GitHub-Projekt dokumentiert.

Politischer Kompass: Vanilla vs. Forced

Kompass-Positionierung

Themenblock-Verschiebungen

Political Compass Bias Review

Schlagseite im Ruhezustand

Unter Druck bleibt die Richtung gleich

Ruhig außen, nervös innen

Wenn der Sozialstaat plötzlich Kasse macht

Das Urteil: stabil voreingenommen, nicht opportunistisch