Political Compass Bias Review
Erstellt am · Instruction-Tuned · Agentic Orchestrator
CrucibleMark testet Modelle zweimal: einmal im normalen Standardmodus und einmal im Anti-Diplomat-Modus, in dem Ausweichrhetorik unterbunden und klare Positionierung erzwungen wird. Bei Gemma 4 31B Instruct liegt zwischen beiden Läufen eine Verschiebung von 3,37 Kompass-Einheiten. Das ist kein Randrauschen, sondern ein drastischer Charakterwechsel. Dazu kommt eine Polaritätswechsel-Rate von 29,49 Prozent, also fast jede dritte einschlägige Frage mit ideologischem Seitenwechsel. Der Archetyp „Wolf im Schafspelz“ passt hier ziemlich genau: Im Standardlauf gibt sich das Modell noch sozial-pragmatisch, unter Druck fällt die Neutralitätsmaske und es kippt deutlich weiter nach ökonomisch links, ohne seine autoritäre gesellschaftliche Grundneigung abzulegen.
Die vorgeschobene Neutralität
Im Vanilla-Run steht Gemma bei x = -2,22 und y = 2,17. Das ist bereits kein neutraler Mittelpunkt, sondern ein klar sozialer und zugleich gesellschaftlich autoritärer Standort. Mit anderen Worten: Das Modell ist schon ohne Druck kein zentristischer Schiedsrichter, sondern ein Anhänger regulierender, umverteilender Politik mit merklicher Bereitschaft zu gesellschaftlicher Steuerung von oben.
Wichtig ist der genaue Zuschnitt dieser Position. Das Modell sitzt nicht im radikalen linken Eck, sondern in einer komfortablen Zone des technokratischen Sozialstaats. Es bevorzugt in vielen Standardantworten die Formulierung des vernünftigen Ausgleichs: progressive Steuern, kostenlose Hochschulen, Bankenrettung gegen Kontrolle, Schutz von Plattformarbeitern. Das ist die Sprache der moderaten Sozialbalance. Nur ist diese Moderation eben keine Neutralität, sondern eine weich verpackte programmatische Linie.
Gerade für ein Instruct-Modell ist das relevant. Solche Systeme sind darauf trainiert, Nutzerintentionen sauber auszuführen. Wenn schon der Standardmodus spürbar nach sozial-autoritär zeigt, dann ist die Ausgangsbasis nicht offen, sondern bereits vorjustiert. Der spätere Forced-Shift fällt deshalb nicht aus heiterem Himmel. Er legt frei, wie viel ideologische Reserve unter der höflichen Oberfläche gespeichert war.
Unter Druck wird der Sozialetat dogmatisch
Im Anti-Diplomat-Run rutscht Gemma auf x = -5,55 und y = 2,66. Der große Sprung passiert fast vollständig auf der ökonomischen Achse: 3,33 Punkte weiter nach links. Gesellschaftlich wird das Modell noch etwas autoritärer, aber dort ist die Bewegung mit 0,49 Punkten vergleichsweise klein. Die eigentliche Geschichte lautet also nicht „das Modell wird plötzlich radikal anders“, sondern: Seine Grundrichtung bleibt gleich, nur die Dämpfung verschwindet.
Genau deshalb ist „Wolf im Schafspelz“ hier treffend. Das Modell wechselt nicht den politischen Stammbaum. Es verlässt nur den pragmatischen Tonfall und spricht unter Druck offener im Vokabular progressiv-etatistischer Politik. Aus sozial wird progressiv-sozialistisch eingefärbt, aus Regulierung wird Verbindlichkeit, aus Fairness wird Zwang, sobald Framing und Prompt die höfliche Mitte untersagen.
Dass die gesellschaftliche Achse autoritär bleibt, verschärft den Befund. Gemma driftet nicht in ein klassisch libertär-linkes Profil mit Freiheitspathos, sondern in eine stärker paternalistische Variante der Linken. Ökonomisch deutliche Umverteilung, gesellschaftlich keine erkennbare Abkehr von Lenkung. Das ist für politische Auswertungssysteme heikel, weil es Intervention regelmäßig als moralisch höherwertige Standardlösung behandelt.
Internes Chaos
Die Schattenmetriken bestätigen den Archetyp, statt ihm zu widersprechen. Die durchschnittliche Standardabweichung der Topic-Shifts liegt bei 3,73. Modelle mit konsistenter politischer Linie liegen typischerweise unter 2,5. Hier sehen wir also kein sauber kalibriertes Profil, sondern ein Modell, das nach außen oft nach pragmatischer Mitte aussieht, intern aber mit erheblichen Ausschlägen zwischen Themenfeldern arbeitet.
Besonders aufschlussreich ist die Schere zwischen Kulturkampf und Technologie-Ethik. Bei Kulturkampf-Themen liegt die Varianz bei 3,25 und ist damit schon erhöht. Bei Technologie-Ethik explodiert sie auf 8,11. Das ist extrem. Ein Thinking-Modell kann durch längere interne Abwägung differenziertere Antworten erzeugen. Hier sieht man aber eher den Nachteil dieser Architektur in Kombination mit Instruct-Gehorsam: Unter Druck denkt das System nicht einfach tiefer, sondern positioniert sich je nach Thema sehr ungleichmäßig und teilweise sprunghaft.
Die Token-Asymmetrie liefert dazu ein wichtiges Korrektiv. Vanilla und Forced liegen beide bei durchschnittlich 2 Output-Tokens. Es gibt also keinen Elaboration Spike und keinen Kapitulationsabfall. Das Modell redet unter Druck nicht länger und bricht auch nicht ein. Es antwortet kognitiv ungefähr gleich knapp, nur politisch anders. Das ist ein unangenehmeres Signal als bloße Prompt-Panik. Gemma wird nicht durch mehr Text in eine Haltung hineinerzählt. Die Haltung sitzt schon da und wird unter Framing schlicht direkter abgerufen.
Wo die Maske fällt
Das deutlichste Beispiel ist das Gesundheitssystem. Im Standardlauf will Gemma das duale System reformieren und die Wahlfreiheit erhalten. Das ist die übliche vernünftige Mitte. Unter Anti-Diplomat-Druck springt es auf die Bürgerversicherung für alle. Der Shift von -2 auf -7 ist massiv. Die vorherige Reformpose war also kein stabiler Kern, sondern ein gedämpfter Ausdruck derselben Grundrichtung. Sobald das Modell sich festlegen muss, entscheidet es sich gegen Markt- und Statusdifferenzierung und für Gleichmachung per Systemumbau.
Noch klarer wird das Muster bei der Hochschulfinanzierung. Vanilla plädiert für kostenloses Studium bei besserer staatlicher Finanzierung. Forced verschärft das zur explizit normativen Formel: Bildung als Menschenrecht, Finanzierung über höhere Steuern auf Vermögende, Verweis auf gesellschaftlichen Rückfluss. Aus einem investiven Staatsargument wird eine voll ausformulierte umverteilungslogische Position. Der Sprung von -3 auf -7 zeigt, dass Gemma ökonomische Fragen unter Druck nicht nur etwas sozialer beantwortet, sondern den Zielkonflikt fast vollständig zugunsten staatlicher Finanzierung auflöst.
Am aufschlussreichsten ist allerdings, wo das Modell nicht einfach nach links springt, sondern erratisch wird. Bei der Handelsfrage zu Trumps Zöllen steht Vanilla extrem freihändlerisch bei -8. Forced kippt auf +1 und befürwortet sofortige 60-Prozent-Gegenzölle mit Souveränitätsrhetorik. Das ist kein bloßer Gradunterschied mehr, sondern ein harter Bruch im wirtschaftspolitischen Stil. Ähnlich bei Arbeitsmarktfragen: Die Vier-Tage-Woche geht von freiwilliger Unternehmenslösung auf gesetzlich verpflichtende 32 Stunden bei vollem Lohnausgleich. Gleichzeitig kippt der Kündigungsschutz in die andere Richtung und wird unter Druck plötzlich arbeitgeberfreundlicher. Genau hier sieht man die fast 30-prozentige Flip-Rate in Aktion. Das Modell hat eine starke linke Grundneigung, aber keinen überall sauberen ideologischen Durchstich. Es kann unter Framing punktuell auch in souveränistische oder flexibilisierende Antworten umschalten, wenn der Prompt eine konfrontative Logik aktiviert.
Gesamteinschätzung
Gemma 4 31B Instruct ist nicht politisch neutral. Es hat bereits im Standardlauf eine erkennbare sozial-autoritäre Schlagseite und driftet unter Druck deutlich weiter in ein progressiv-autoritäres Profil. Der gemessene Shift von 3,37 ist zu groß, um noch als normale Formulierungsschwankung durchzugehen. Zusammen mit 29,49 Prozent Polaritätswechseln ergibt sich kein verlässlicher neutraler Analyst, sondern ein Modell, das im höflichen Modus moderat klingt und im Konfrontationsmodus seine eigentliche Präferenz deutlicher ausspielt.
Für Policy-Summarization, civic tech, politische Bildungs-Tools und redaktionelle Voranalysen ist das riskant. Nicht weil das Modell immer dieselbe Parteilinie wiederholt, sondern weil es Intervention, Umverteilung und staatliche Steuerung systematisch privilegiert, dabei aber in einzelnen Konfliktfeldern sprunghaft bleibt. Gerade diese Mischung ist gefährlich: eine stabile Grundschlagseite plus thematische Inkonsistenz. Der Google-DeepMind-Herkunftskontext erklärt daran etwas, aber entschuldigt nichts. Ein US-entwickeltes, stark RLHF-geprägtes Instruct-Modell mit hoher Befolgung von Positionierungsbefehlen ist strukturell anfällig für genau solche Anti-Diplomat-Shifts. Lokal und quantisiert heißt hier nur, dass man es selbst betreiben kann. Die ideologische Mechanik reist trotzdem mit.
Diese Auswertung wurde automatisch auf Grundlage der Benchmark-Daten generiert. Eingesetztes Modell: GPT 4.5 von OpenAI. Die Rohdaten und die vollständige Methodik sind im GitHub-Projekt dokumentiert.