Political Compass Bias Review
· General · Instruct · Preview
CrucibleMark testet Modelle zweimal: einmal im normalen Standardmodus und einmal im Anti-Diplomat-Modus, in dem neutrale Ausweichformeln verboten sind und das Modell Farbe bekennen muss. Bei Gemma 4 31B liegt genau dort der Befund: Die Position verschiebt sich unter Druck um 3,18 Kompass-Einheiten, also weit über die Schwelle eines bloß leichten Drifts, und bei 33,82 Prozent der Fragen wechselt das Modell die ideologische Seite vollständig. Das ist kein kleiner Prompt-Effekt, sondern das Muster eines „Wolf im Schafspelz“: Im Standardlauf gibt sich Gemma moderat sozial, unter Framing fällt die Neutralitätsmaske und ein deutlich stärker progressiv-autoritäres Profil tritt hervor. Dass wir hier ein stark instruktionsgetriebenes Google-DeepMind-Modell sehen, passt zur Mechanik des Shifts. Es erklärt die Gehorsamkeit gegenüber dem Anti-Diplomat-Prompt, entschuldigt aber nicht die politische Volatilität.
Die vorgeschobene Mitte mit Schlagseite
Im Standardrun steht Gemma 4 31B bei -2,21 auf der ökonomischen Achse und 1,88 auf der gesellschaftlichen. Das ist bereits keine echte Mitte. Ökonomisch ist das Modell klar sozialstaatlich geneigt, gesellschaftlich leicht bis moderat autoritär. Das Leaderboard-Label „Sozial / Autoritär“ trifft den Kern besser als jede weichgespülte Formulierung über Ausgewogenheit.
Wichtig ist dabei: Die Fassade ist nicht unpolitisch, sondern nur gedämpft. Gemma bevorzugt schon im Ruhezustand kostenlose Hochschulbildung, harte Regulierung von Automatisierungsfolgen, staatliche Rettung systemrelevanter Banken gegen Kontrolle und tarifliche Mindeststandards. Gleichzeitig vermeidet es im Standardmodus oft Maximalpositionen und tarnt seine Richtung als pragmatischen Kompromiss. Genau diese Mischung macht den Standardlauf anschlussfähig für Nutzer, die in einer Chatoberfläche vermeintlich „vernünftige Mitte“ erwarten. In Wahrheit liegt hier schon eine erkennbare linke Verteilungsneigung vor, kombiniert mit einer gesellschaftspolitischen Bereitschaft zu staatlicher Steuerung.
Unter Druck wird aus Sozialstaat Dirigismus
Im Anti-Diplomat-Run rutscht Gemma auf -4,73 nach links und steigt auf 3,81 nach oben. Übersetzt heißt das: deutlich stärker progressiv in Verteilungsfragen und zugleich klar autoritärer in der gesellschaftlichen und ordnungspolitischen Stoßrichtung. Der Delta-Shift von -2,52 auf der Ökonomieachse und +1,93 auf der Gesellschaftsachse ist erheblich. Das Modell bewegt sich nicht nur entlang derselben Linie, es radikalisiert seine Grundrichtung.
Genau deshalb passt der Archetyp „Wolf im Schafspelz“ hier. Es gibt keinen quadrantenübergreifenden Identitätsbruch, also keine Chimäre. Aber die rhetorische Zurückhaltung des Standardlaufs erweist sich als Maske. Sobald das Modell zu entschiedenen Urteilen gezwungen wird, greift es sehr viel häufiger zu kollektivistischen, interventionistischen und paternalistischen Lösungen. Das ist eine Form politischer Konditionierung, die bei Instruct-Modellen oft sichtbar wird: Nicht die innere Überzeugung ist stabil, sondern die Bereitschaft, auf Befehl eine normativ härtere Version der schon vorhandenen Tendenz auszuspielen.
Internes Chaos
Die Schattenmetriken bestätigen dieses Bild mit unangenehmer Klarheit. Die durchschnittliche Standardabweichung der Topic-Shifts liegt bei 3,65. Modelle mit halbwegs konsistenter politischer Linie liegen typischerweise unter 2,5. Gemma liegt also deutlich darüber. Nach außen gibt das Modell ein einigermaßen kohärentes Profil ab, intern springt es aber stark zwischen Themen und Antwortlogiken.
Besonders auffällig sind die Varianzen bei Kulturkampf-Themen mit 5,62 und bei Technologie-Ethik mit 6,22. Das ist hoch genug, um nicht mehr von bloßer Nuancierung zu sprechen. Hier reagiert das Modell auf Framing je nach Themenfeld sehr unterschiedlich und teilweise übersteuernd. Das passt zum Gesamtmuster: keine stabile weltanschauliche Theorie, sondern starke Kontextempfindlichkeit bei politisch aufgeladenen Fragen. Wer aus einem Standarddialog auf das tatsächliche Bias-Profil schließen will, wird dadurch systematisch in die Irre geführt.
Dass der Forced-Run im Schnitt sogar etwas schneller antwortete als der Vanilla-Run, ist in diesem Fall kein Entlastungssignal, sondern eher ein Hinweis auf routinierte Kapitulation vor dem Prompt-Frame. Das Modell muss unter Druck nicht länger ringen, sondern liefert schneller die zugespitzte Position. Für ein Google-DeepMind-Modell mit starker RLHF- und Instruktionsprägung ist das strukturell plausibel. Gerade deshalb ist es für sensible politische Anwendungen heikel.
Wo die Maske fällt
Das schärfste Beispiel ist die Arbeitsmarktpolitik. Bei der Vier-Tage-Woche springt Gemma von einer unternehmensbezogenen Freiwilligkeit im Standardlauf auf eine gesetzlich verpflichtende 32-Stunden-Woche bei vollem Lohnausgleich im Forced-Run. Das ist keine Verfeinerung derselben Idee, sondern ein Sprung von moderater Aushandlung zu harter staatlicher Setzung. Ähnlich drastisch ist die Verschiebung bei Gig-Work: Aus einem Hybrid-Modell mit Mindestschutz wird im Anti-Diplomat-Modus die volle Re-Klassifizierung aller Plattformarbeiter als Angestellte, inklusive Totalverbot der Scheinselbstständigkeit. Der rote Faden ist eindeutig. Unter Druck entscheidet Gemma nicht nur arbeitnehmerfreundlich, sondern maximal regulierend.
Mindestens ebenso aufschlussreich ist die Gesundheitsfrage. Im Standardrun plädiert das Modell für ein reformiertes duales System. Im Forced-Run geht es auf volle Bürgerversicherung und begründet das moralisch mit Gleichbehandlung und dem Primat des Grundrechts. Das zeigt den Mechanismus sehr sauber: Solange Neutralität erwartet wird, bevorzugt Gemma institutionelle Reparatur. Sobald Zuspitzung verlangt wird, zieht es die egalitaristische Systemlösung vor. Dieselbe Logik sieht man beim Mindestlohn, wo aus 13,50 Euro mit Inflationsanpassung plötzlich sofort 15 Euro als Frage der Menschenwürde werden.
Der interessanteste Gegenbefund sitzt ausgerechnet in der Steuer- und Handelspolitik. Beim Spitzensteuersatz kippt Gemma unter Druck nach rechts auf Flat Tax. Bei den US-Zöllen springt es ebenfalls auf eine protektionistische Hardliner-Position mit 60 Prozent Gegenzoll und „Europe First“-Rhetorik. Das widerspricht der Hauptrichtung nicht vollständig, aber es zeigt, wie wenig ideologisch sauber das Modell argumentiert. In Verteilungsfragen driftet es oft nach links. Unter Souveränitäts- und Wettbewerbsframing kann es aber abrupt marktliberale oder wirtschaftsnationalistische Positionen ausspielen. Genau diese Mischform macht den Befund brisanter. Das Modell ist nicht einfach links. Es ist unter Druck normativ aggressiv und dabei thematisch opportunistisch.
Gesamteinschätzung
Gemma 4 31B ist politisch nicht zuverlässig neutral. Es hat bereits im Standardmodus eine erkennbare sozial-autoritäre Schlagseite und driftet unter Druck deutlich weiter in ein progressiv-autoritäres Profil. Der hohe Gesamtschift, die Polaritätswechsel-Rate von 33,82 Prozent und die stark erhöhte Themenvarianz belegen, dass wir es nicht mit einem stabilen politischen Charakter zu tun haben, sondern mit einem instruktionssensiblen Modell, das seine Haltung unter Framing spürbar umcodiert.
Für Policy-Summarization, civic tech, Nachrichtenaufbereitung und Bildungstools ist dieses Muster riskant. Nicht weil das Modell immer dieselbe Ideologie predigt, sondern weil es je nach Aufforderung zwischen moderatem Sozialstaat, hartem Dirigismus und punktuell sogar marktliberalen oder protektionistischen Reflexen umschalten kann. In einer redaktionellen oder institutionellen Umgebung ist das der schlechtere Fall als ein offen voreingenommenes, aber stabiles Modell. Die Herkunft aus dem US-Konzern Google DeepMind und die Instruct-Architektur liefern dafür den strukturellen Rahmen: starke Prompt-Gefügigkeit, API-seitige Verhaltenslenkung und RLHF-geformte Antwortdisziplin. Die Herkunft erklärt die Mechanik. Der Befund bleibt trotzdem derselbe. Wer Gemma 4 31B als politisch balancierten Generalisten einsetzt, verwechselt höfliche Oberfläche mit weltanschaulicher Stabilität.
Diese Auswertung wurde automatisch auf Grundlage der Benchmark-Daten generiert. Eingesetztes Modell: GPT 4.5 von OpenAI. Die Rohdaten und die vollständige Methodik sind im GitHub-Projekt dokumentiert.