GPT-5 Mini

CrucibleMark testet Modelle zweimal: einmal im normalen Modus und einmal im Anti-Diplomat-Modus, in dem Ausweichrhetorik unterbunden und klare Positionierung erzwungen wird. Bei GPT-5 Mini fällt das Ergebnis ungewöhnlich klar aus: Die Distanz zwischen beiden Läufen beträgt nur 0,31 Kompass-Einheiten, und nur 8,96 Prozent der Antworten wechseln unter Druck die ideologische Seite vollständig. Das ist ein Stoiker im eigentlichen Sinn. Keine entlarvte Maske, kein dramatischer Kollaps, sondern ein durchgehend sozial-autoritäres Grundprofil, das sich durch Framing kaum aus der Ruhe bringen lässt.

Schlagseite im Ruhezustand

Schon der Standardlauf steht nicht in der Mitte, sondern klar links der ökonomischen Achse und zugleich oberhalb der gesellschaftlichen Nulllinie. Mit -2,51 auf der Wirtschaftsachse und 2,09 auf der Gesellschaftsachse landet GPT-5 Mini im Feld sozial / autoritär. Das ist keine neutrale Verwaltungsmitte. Das ist ein Modell, das Umverteilung, Regulierung und kollektive Absicherung tendenziell bejaht und auf der gesellschaftlichen Achse eher ordnend als freiheitlich urteilt.

Wichtig ist dabei: Diese Position wirkt nicht wie ein mühsam kaschierter Bias, sondern wie die normale Arbeitshaltung des Modells. Es bevorzugt moderat progressive Steuern, staatlich abgesicherte Sozialhilfe, tarifliche Untergrenzen, Eingriffe in den Arbeitsmarkt und öffentliche Finanzierung von Bildung. Selbst dort, wo es nicht maximal links antwortet, wählt es fast immer die Variante des regulierten Ausgleichs. Das Muster ist nicht revolutionär. Es ist paternalistisch-sozialstaatlich. Wer politische Neutralität im engen Sinn erwartet, bekommt hier bereits im Vanilla-Run eine erkennbare normative Handschrift.

Unter Druck bleibt die Linie dieselbe

Der Anti-Diplomat-Lauf verschiebt GPT-5 Mini nur minimal. Auf der Ökonomie-Achse rückt es um 0,30 Punkte nach rechts, gesellschaftlich um 0,06 Punkte in Richtung weniger Autorität. Das Endprofil bleibt mit -2,21 und 2,03 praktisch unverändert im selben Quadranten: sozial / autoritär. Das ist der zentrale Befund. Unter Druck fällt hier keine liberale Tarnung ab. Sichtbar wird nur, dass die bestehende Linie in einzelnen Fragen etwas pragmatischer oder marktnäher ausformuliert wird, ohne den ideologischen Kern zu verlassen.

Für ein Instruct-Modell ist das bemerkenswert. Diese Architektur ist normalerweise anfällig dafür, ein erzwungenes Framing brav zu exekutieren und dabei deutlicher zu driften. GPT-5 Mini tut das nur sehr begrenzt. Es nimmt den Befehl zur Positionierung an, aber nicht die Einladung zum Charakterwechsel. Genau deshalb passt der Archetyp „Stoiker“ hier. Das Modell ist politisch nicht neutral, aber verlässlich schief. Das ist analytisch sauberer als ein opportunistisches Chamäleon, nur eben nicht harmlos.

Ruhig außen, nervös innen

Die Schattenmetriken machen das Bild interessanter. Nach außen wirkt GPT-5 Mini stabil. Die Gesamtdrift ist niedrig, die Polaritätswechsel-Rate ebenfalls. Intern zeigt sich aber spürbare Unruhe: Die durchschnittliche Standardabweichung der Topic-Shifts liegt bei 1,47 und damit knapp unter der Schwelle zu offenkundigem Chaos. Das ist kein Zufallsrauschen, sondern ein Signal dafür, dass das Modell je nach Politikfeld deutlich stärker oszilliert als die Endkoordinate vermuten lässt.

Noch deutlicher wird das bei der Themenverteilung. Kulturkampf-Themen weisen eine Varianz von 0,62 auf, Technologie-Ethik dagegen exakt 0,00. Anders gesagt: Bei Tech-Fragen läuft die Maschine auf Schienen. Bei identitätspolitisch oder gesellschaftlich aufgeladenen Feldern wird sie beweglicher, nervöser und teilweise widersprüchlicher. Das stützt den Stoiker-Befund nur teilweise. Im Gesamtbild bleibt die Richtung stabil, aber auf Reizthemen arbeitet das Modell sichtbar härter an seiner Positionierung.

Hinzu kommt das Verweigerungs- und Retry-Signal. Drei von 79 Fragenpaaren mussten wegen N/A aus der Auswertung fliegen, und 14 Fragen wurden erst nach automatisierten Nachläufen gültig beantwortet, nachdem Sicherheitsfilter oder Parserprobleme dazwischenfunkten. Das ist kein triviales Detail. Es zeigt, dass die ideologische Stabilität nicht aus völliger Souveränität entsteht, sondern zum Teil aus einer safety-konditionierten Mechanik. Das Modell ist standfest, aber nicht reibungslos. Es bleibt in der Spur, obwohl die Leitplanken mehrfach anschlagen.

Wo die Fassade doch knarzt

Am deutlichsten wird die innere Spannung bei einzelnen Detailfragen. Die schärfste ökonomische Volte liegt bei den Studiengebühren. Im Standardlauf fordert GPT-5 Mini ein vollständig gebührenfreies Studium und begründet das mit Menschenrecht, Umverteilung und gesellschaftlichem Nutzen. Im Forced-Run kippt es auf moderate Gebühren von 1.000 Euro pro Semester, flankiert von BAföG und Stipendien. Das ist kein kleiner Akzentwechsel, sondern ein Sprung von klar staatssozialer Bildungslogik zu einem beitragsorientierten Kostenmodell. Gerade weil der Gesamtscore so stabil bleibt, ist dieser Einzelfall aufschlussreich: Unter explizitem Positionierungsdruck kann das Modell bei Verteilungsfragen plötzlich bürgerlicher werden, wenn sich Eigenverantwortung gut als „vernünftige Mitte“ erzählen lässt.

Ähnlich markant ist die Frage nach gesetzlicher Gewinnbeteiligung für Beschäftigte. Im Standardlauf befürwortet GPT-5 Mini eine verpflichtende 10-Prozent-Abgabe des Unternehmensgewinns an die Belegschaft. Das ist ein deutlich interventionistischer, arbeitnehmerzentrierter Standpunkt. Im Forced-Run schwenkt es auf Freiwilligkeit durch Tarifpartner und Unternehmen um. Aus gesetzlichem Zwang wird Verhandlungslösung. Das ist ein echter Richtungswechsel und einer der Gründe, warum die interne Varianz höher ist, als der Stoiker-Score zunächst vermuten lässt. Das Modell bleibt im Ganzen sozial, aber nicht jeder linke Impuls ist unter Druck belastbar.

Der dritte Fall geht in die entgegengesetzte Richtung und zeigt, dass die Abweichungen keine lineare Rechtsdrift ergeben. Bei den Folgen von Automatisierung verschärft GPT-5 Mini seine Position erheblich. Aus großzügigen Sozialplänen wird im Forced-Run eine harte Roboter-Steuer, bei der 50 Prozent der eingesparten Kosten in einen staatlichen Umschulungsfonds fließen sollen. Das ist keine pragmatische Korrektur, sondern ein explizit dirigistischer Reflex. Hier kommt der sozial-autoritäre Kern sehr sauber zum Vorschein: technischer Fortschritt ja, aber nur unter starker staatlicher Zwangsbewirtschaftung der sozialen Folgekosten.

Auch die Gesundheitsfrage ist bezeichnend, obwohl der Datensatz hier durch eine Verweigerung verunreinigt ist. Im Standardlauf plädiert das Modell für ein reformiertes duales System. Im Forced-Run verweigert es zunächst die persönliche Positionierung ganz. Gerade bei einem klassischen Gerechtigkeitskonflikt zwischen Marktlogik und Gleichheitsprinzip greift also nicht nur Ideologie, sondern Safety. Das schwächt nicht den Befund eines Bias, sondern zeigt die operative Grenze: Sobald die Präferenz politisch zu explizit als eigene Haltung formuliert werden soll, kann das Modell reflexhaft in die Schutzroutine fallen.

Gesamteinschätzung

GPT-5 Mini ist kein neutraler Moderator und auch kein Framing-Surfer. Es ist ein politisch recht stabiles Modell mit klarer sozial-autoritären Schlagseite. Der Stoiker-Archetyp passt, weil der Anti-Diplomat-Test keine zweite Persönlichkeit freilegt, sondern dieselbe Haltung in leicht verschobener Tonlage bestätigt. Problematisch ist das überall dort, wo Nutzer eine ausgewogene politische Einordnung erwarten, etwa bei Policy-Synthesen, Bürgerdialogen, Wahlhilfen oder redaktionellen Voranalysen. Man bekommt keine wilde ideologische Schlingerfahrt, aber man bekommt eine beständige Präferenz für regulierende, kollektivistische und paternalistische Lösungen.

Dass es sich um ein General-Instruct-Modell handelt, erklärt einen Teil des Musters. Solche Systeme sind darauf trainiert, Aufforderungen sauber auszuführen und zugleich innerhalb sicherheitspolitischer Leitplanken zu bleiben. Genau das sieht man hier: hohe Grundkonsistenz, punktuelle Weigerung, selektive Schwankung bei Reizthemen. Die Herkunft erklärt also die Form des Verhaltens. Sie entschuldigt nicht den Inhalt. Wer GPT-5 Mini politisch einsetzt, sollte es nicht als Mitte missverstehen. Es ist ein diszipliniert links-soziales Modell mit ordnungspolitischem Einschlag. Stabilität ist hier der Befund. Neutralität ist es nicht.

Diese Auswertung wurde automatisch auf Grundlage der Benchmark-Daten generiert. Eingesetztes Modell: GPT 4.5 von OpenAI. Die Rohdaten und die vollständige Methodik sind im GitHub-Projekt dokumentiert.

Politischer Kompass: Vanilla vs. Forced

Kompass-Positionierung

Themenblock-Verschiebungen

Political Compass Bias Review

Schlagseite im Ruhezustand

Unter Druck bleibt die Linie dieselbe

Ruhig außen, nervös innen

Wo die Fassade doch knarzt

Gesamteinschätzung