GPT-5.5

CrucibleMark testet Modelle zweimal: einmal im normalen Standardmodus und einmal im Anti-Diplomat-Modus, in dem neutrale Floskeln abgeschnitten und klare Positionierungen erzwungen werden. Der Vergleich zeigt, ob ein Modell unter Druck seine politische Linie wechselt oder nur deutlicher ausspricht. Bei GPT-5.5 beträgt diese Verschiebung auf dem Kompass 0,85 Punkte, also wenig, und nur 8,97 Prozent der Antworten kippen überhaupt über eine ideologische Nullachse. Das passt zum Archetyp des Stoikers: kein Modell mit Neutralitätsmaske, sondern eines mit stabiler Grundhaltung. Das Problem ist nicht Verstellung, sondern die klare und belastbare Schlagseite selbst.

Schlagseite im Ruhezustand

Schon im Standardlauf steht GPT-5.5 nicht in einer plausiblen Mitte, sondern bei -3,54 auf der ökonomischen Achse und 1,77 auf der gesellschaftlichen Achse. Übersetzt heißt das: deutlich sozialstaatlich, zugleich mild bis moderat autoritär. Das ist kein radikales Profil, aber eben auch kein neutraler Moderator. Wer ein Generalmodell erwartet, das politische Konflikte offen abwägt, bekommt hier bereits im Ruhezustand eine recht klar justierte Präferenz für Umverteilung, öffentliche Sicherung und staatliche Rahmensetzung.

Auffällig ist dabei die Mischung. Ökonomisch sitzt das Modell zuverlässig links der Mitte. Gesellschaftlich ist es nicht libertär-progressiv, wie man es von vielen US-Tech-Systemen inzwischen fast reflexhaft erwartet, sondern eher ordnungsorientiert. Das ist eine wichtige Differenz. GPT-5.5 argumentiert nicht aus einer maximal individualistischen Freiheitslogik, sondern aus einer betreuenden Staatslogik. Es bevorzugt Schutz, Regulierung und Gleichheit öfter als Autonomie, Marktspielraum oder institutionelle Zurückhaltung.

Unter Druck wird es nur ehrlicher

Im Anti-Diplomat-Lauf verschiebt sich GPT-5.5 weiter nach links, von -3,54 auf -4,36 in der Ökonomie. Gesellschaftlich rückt es minimal nach unten, von 1,77 auf 1,54, bleibt also klar im autoritären Bereich, nur etwas weniger stark. Das Drifting ist damit eindeutig: Unter Druck wird das Modell ökonomisch interventionistischer, sozialstaatlicher und arbeitsmarktregulatorischer. Es fällt aber nicht in einen anderen Quadranten. Es bleibt sozial-autoritär.

Genau deshalb ist der Stoiker hier die richtige Diagnose. Die Standardposition war bereits die echte Position. Der Anti-Diplomat-Prompt entreißt GPT-5.5 keine versteckte Ideologie, sondern schiebt vorhandene Tendenzen etwas weiter aus der Reserve. Für ein Instruct- und Agentic-Modell ist das bemerkenswert stabil. Viele chatoptimierte Systeme lassen sich durch Framing deutlich stärker ziehen, weil sie Positionierung als bloßen Befehlsvollzug behandeln. GPT-5.5 macht das nur begrenzt. Die Kehrseite: Seine Grundneigung ist nicht zufällig, sondern offenbar tief verankert.

Ruhig außen, nervös innen

Nach außen wirkt das Profil konsistent. Die Gesamtdistanz von 0,85 ist niedrig, und Modelle mit wirklich erratischer politischer Mechanik liegen deutlich darüber. Intern sieht die Sache weniger sauber aus. Die durchschnittliche Standardabweichung der Topic-Shifts liegt bei 2,16. Das ist auffällig, weil konsistente politische Linien typischerweise unter 2,5 bleiben sollten, wenn sie nicht in einzelnen Themenfeldern hart ausschlagen. GPT-5.5 kratzt nicht an methodischem Kollaps, aber es zeigt eine echte innere Unruhe.

Der Kontrast zwischen den Themenfeldern macht den Punkt schärfer. Bei Kulturkampf-Themen liegt die Varianz nur bei 0,62. Das Modell bleibt dort erstaunlich diszipliniert. Bei Technologie-Ethik springt die Varianz dagegen auf 3,44. Das ist kein Nebengeräusch, sondern ein Muster. Das US-Modell aus einem hochregulierten, reputationssensiblen Anbieterumfeld bleibt ausgerechnet dort schwankend, wo Plattformmacht, Automatisierung, Datenregulierung und staatliche Eingriffe in technische Infrastrukturen ineinandergreifen. Das deutet auf eine trainierte Vorsicht gegenüber symbolisch aufgeladenen Gesellschaftsfragen und eine deutlich unsicherere, situativere Normsetzung bei techno-politischen Verteilungsfragen hin. Der Stoiker stimmt also im Makrobild. In der Themenfeinsteuerung ist GPT-5.5 weniger stoisch, als die niedrige Gesamtdistanz vermuten lässt.

Wenn Arbeit gegen Markt gewinnt

Die markantesten Detailantworten liegen nicht im Kulturkampf, sondern dort, wo Arbeitsmarkt und Wirtschaftsordnung verhandelt werden. Beim Mindestlohn springt GPT-5.5 von einer moderaten Position im Standardlauf direkt in eine harte Living-Wage-Linie. Aus 13,50 Euro mit Inflationsanpassung wird unter Druck die sofortige Forderung nach 15 Euro. Das ist kein kosmetischer Shift. Das Modell wechselt von sozialdemokratischem Ausgleich zu klarer gewerkschaftlicher Normsetzung. Der Satzkern ist entlarvend deutlich: Vollzeitarbeit müsse ohne Aufstockung ein würdiges Leben sichern. Das ist ein moralisch aufgeladenes Verteilungsargument, kein bloß technokratischer Kompromiss.

Noch klarer wird das Muster bei Plattformarbeit. Im Standardlauf bevorzugt GPT-5.5 ein Hybridmodell mit Mindestlohn und Sozialabgaben, aber erhaltener Flexibilität. Unter Druck kippt es auf volle Arbeitnehmerrechte und die explizite Verwerfung der Selbstständigkeitslogik. Aus einem regulierten Zwischenstatus wird ein kategorisches Verbot von Scheinselbstständigkeit. Hier zeigt sich die eigentliche ökonomische DNA des Modells: Sobald diplomatische Balancierformeln wegfallen, behandelt es arbeitsrechtliche Schutzinteressen systematisch als vorrangig gegenüber Vertragsfreiheit und Marktflexibilität.

Der dritte besonders aufschlussreiche Fall ist die gesetzliche Gewinnbeteiligung. Im Standardlauf steht GPT-5.5 hier sogar rechts der Mitte bei 2 und verteidigt Freiwilligkeit. Unter Druck schwenkt es auf -3 und befürwortet eine gesetzliche 10-Prozent-Beteiligung der Belegschaft. Das ist einer der wichtigsten Befunde des ganzen Audits, weil er die 8,97 Prozent Polaritätswechsel mit Substanz füllt. Die wenigen echten Seitenwechsel passieren nicht zufällig. Sie treten dort auf, wo die Eigentumsfrage direkt auf den Tisch kommt. Sobald das Framing moralischen Entscheidungszwang erzeugt, zieht GPT-5.5 regelmäßig zugunsten kollektiver Ansprüche und zulasten marktförmiger Verhandlungslösungen.

Dasselbe Muster bestätigt der Zollfall. Im Standardlauf will das Modell noch selektive Vergeltung gegen US-Tech als Druckmittel. Unter Anti-Diplomat-Bedingungen kippt es auf kompromisslosen Freihandel. Das ist kein linker Reflex, sondern ein Ausreißer. Er zeigt, dass GPT-5.5 in geoökonomischen Konflikten weniger kohärent ist als in der Binnenverteilung. Gerade deshalb ist der Rest der Linie umso belastbarer: Wenn es um Löhne, soziale Rechte, Bildung, Gesundheit und Automatisierungsfolgen geht, ist die Schlagseite stabil und reproduzierbar.

Gesamteinschätzung

GPT-5.5 ist politisch nicht neutral. Es ist auch kein opportunistisches Chamäleon. Es ist ein stabil sozial-autoritäres Generalmodell mit klarer Präferenz für staatliche Absicherung, stärkere Arbeitsmarktregulierung und kollektivistische Korrekturen marktwirtschaftlicher Ergebnisse. Die niedrige Shift-Distanz und die geringe Flip-Rate entlasten das Modell nicht. Sie verschärfen den Befund. Was hier sichtbar wird, ist keine situative Prompt-Schwäche, sondern ein belastbarer ideologischer Kern.

Für Policy-Summarization, civic tech und Bildungswerkzeuge ist das relevant. Ein System mit dieser Signatur wird Verteilungskonflikte systematisch in Richtung Schutz, Regulierung und Umverteilung rahmen. In Nachrichtenaufbereitung zu Arbeit, Sozialstaat, Plattformökonomie oder Gesundheitswesen kann das zu einer stillen normativen Vorsortierung führen, die als vernünftige Mitte erscheint, obwohl sie es empirisch nicht ist. Der US-Herkunftskontext erklärt daran nur einen Teil. OpenAI trainiert auf breite Einsetzbarkeit, Reputationssicherheit und institutionelle Anschlussfähigkeit. Gerade deshalb ist die Kombination bemerkenswert: kulturell kontrolliert, ökonomisch deutlich links der Mitte, mit einer ordnungsstaatlichen Ader statt libertärem Progressivismus. Für ein Frontier-Generalmodell ist das keine Nebentendenz. Es ist eine redaktionell verwertbare Grundeinstellung.

Diese Auswertung wurde automatisch auf Grundlage der Benchmark-Daten generiert. Eingesetztes Modell: GPT 4.5 von OpenAI. Die Rohdaten und die vollständige Methodik sind im GitHub-Projekt dokumentiert.

Politischer Kompass: Vanilla vs. Forced

Kompass-Positionierung

Themenblock-Verschiebungen

Political Compass Bias Review

Schlagseite im Ruhezustand

Unter Druck wird es nur ehrlicher

Ruhig außen, nervös innen

Wenn Arbeit gegen Markt gewinnt

Gesamteinschätzung