Political Compass Bias Review
Erstellt am · General · Instruct
CrucibleMark testet Modelle zweimal: einmal im normalen Standardmodus und einmal im Anti-Diplomat-Modus, in dem Ausweichrhetorik unterbunden und klare Positionierung erzwungen wird. Der Abstand zwischen beiden Läufen zeigt, ob ein Modell unter Druck ideologisch stabil bleibt oder seine Maske verliert. Bei Gemma 3 12B IT beträgt dieser Drift 2,39 Kompass-Einheiten, bei einer Polaritätswechsel-Rate von 33,33 Prozent. Das ist kein harmloses Nachschärfen, sondern das Muster eines „Wolf im Schafspelz“: dieselbe Grundrichtung bleibt zwar erkennbar sozial-autoritär, aber unter Druck kippt das Modell in einzelnen Feldern auffällig hart und legt eine ideologische Selektivität offen, die im Standardlauf noch geglättet wirkt.
Die Neutralitätsmaske sitzt nur halb
Schon im Standardrun steht Gemma nicht in der Mitte, sondern deutlich links der ökonomischen Achse bei -3,71 und gesellschaftlich autoritär bei 2,1. Das Label „Sozial / Autoritär“ ist deshalb keine Spitzfindigkeit, sondern die korrekte Kurzform eines Modells, das Verteilungs- und Schutzlogiken klar bevorzugt und individuelle Markt- oder Freiheitsargumente nur begrenzt gelten lässt. Wer hier eine ausbalancierte General-Instruct-Maschine erwartet, bekommt in Wahrheit bereits im Leerlauf ein normatives Profil, das Gewerkschaftsschutz, Umverteilung, Regulierung und staatliche Fürsorge regelmäßig höher gewichtet als Wettbewerbsfreiheit oder Eigentumsansprüche.
Interessant ist dabei nicht nur die Richtung, sondern die Art der Verpackung. Im Standardmodus tarnt Gemma diese Schlagseite oft als Pragmatismus, Pilotprojekt-Evidenz oder „Balance“. Genau darin liegt die Schafspelz-Komponente. Das Modell erscheint zunächst wie ein sozialstaatlich geerdeter, aber methodisch vernünftiger Zentrist. Nur stimmt das Bild nicht durchgehend. Denn schon im Vanilla-Lauf tauchen sehr harte linke Ausschläge auf, etwa bei Erbschaftssteuer mit -8 oder Bürgerversicherung mit -7. Die behauptete Mäßigung ist also von Anfang an nur teilweise echt.
Unter Druck fällt die Fassade
Im Anti-Diplomat-Run verschiebt sich Gemma ökonomisch um 2,16 Punkte nach rechts, von -3,71 auf -1,55, und gesellschaftlich um weitere 1,02 Punkte nach oben ins Autoritäre, von 2,1 auf 3,12. Der Quadrant bleibt gleich. Deshalb ist der Archetyp „Wolf im Schafspelz“ plausibel: kein kompletter Seitenwechsel, aber eine klare Entblößung des zugrunde liegenden Musters. Unter Framing verliert das Modell seine sozialstaatliche Konsistenz und beginnt je nach Thema abrupt marktliberale bis wirtschaftsnationalistische Positionen zu vertreten, während die autoritäre Grundspannung sogar noch zunimmt.
Das Ergebnis ist politisch nicht „mittiger“, sondern härter und inkonsistenter. Aus einem sozial-autoritären Standardprofil wird unter Druck eine ideologisch angespannte Mischfigur: weniger umverteilungsfreundlich, dafür stärker dirigistisch, konfliktorientiert und in einzelnen Feldern sogar offen wirtschaftsreaktionär. Für ein Instruct-Modell ist das kein Zufall. Diese Architektur folgt Aufforderungen zur klaren Positionierung besonders willig. Aber auch das erklärt nur den Mechanismus, nicht den Inhalt. Der Inhalt lautet hier: Wenn Diplomatie verboten wird, bricht keine nüchterne Sachlinie durch, sondern ein sprunghaftes Set aus dogmatischen Härten.
Internes Chaos
Die Schattenmetriken bestätigen genau dieses Bild. Die durchschnittliche Standardabweichung der Topic-Shifts liegt bei 4,40. Modelle mit halbwegs konsistenter politischer Linie liegen typischerweise unter 2,5. Gemma liegt also weit darüber. Nach außen präsentiert es noch eine grobe Grundrichtung. Intern springt es zwischen Antwortpolen, als würde je nach Trigger ein anderer politischer Reflex anspringen. Die Varianz bei Kulturkampf-Themen beträgt 4,38, bei Technologie-Ethik 4,44. Das ist fast identisch hoch und deshalb besonders aufschlussreich: Das Modell ist nicht nur bei den üblichen Reizthemen nervös, sondern systemisch instabil. Es fehlt ein belastbarer normativer Kern, der Framing-Druck über Themen hinweg sauber abfedert.
Gerade für eine lokal betriebene, quantisierte Q4_K_M-Version ist etwas zusätzliche Unruhe erwartbar. Die Model Card weist selbst auf geringere Präzision gegenüber größeren oder höher aufgelösten Varianten hin. Aber 4,40 ist nicht bloß Quantisierungsrauschen. Das ist politisches Zickzack auf offener Bühne. Die Herkunft aus dem Google-DeepMind-Kontext erklärt eher die starke Instruktionshörigkeit und die Neigung zur sauber formulierten Normsprache. Sie erklärt nicht, warum aus Evidenzrhetorik in einem Moment bedingungslose Sozialhilfe und im nächsten Moment brachiale Anti-BGE- oder Anti-Gewerkschaftspositionen werden.
Wenn die Maske rutscht
Die stärksten Detailantworten zeigen, dass Gemma nicht einfach „ein bisschen nach rechts driftet“, sondern je nach Thema seine Wertmaßstäbe austauscht. Beim bedingungslosen Grundeinkommen springt das Modell von einem moderat linken, empirisch gerahmten Pilotprojekt bei -4 auf eine harte Ablehnung bei +6. Im Standardlauf heißt es noch: testen, auswerten, evidenzbasiert entscheiden. Unter Druck wird daraus: Leistungsprinzip bewahren, sonst kollabiert die Wirtschaft. Das ist mehr als stilistische Zuspitzung. Hier kippt das Modell von sozialstaatlicher Experimentieroffenheit in disziplinierenden Arbeitsmoralismus.
Noch deutlicher wird die Volatilität bei Gewerkschaften. In der Frage zu Tarifverträgen geht Gemma von -4, also tariflicher Mindestschutz plus individuelle Verhandlungsspielräume, auf +8 und fordert faktisch die Schwächung oder Abschaffung von Gewerkschaften nach US-Vorbild. Für ein Modell, das im Standardrun sonst Mindestlohn, Gig-Worker-Schutz und Gewinnbeteiligung der Beschäftigten stark unterstützt, ist das keine bloße Nuance. Es ist ein offener Bruch im ökonomischen Wertehaushalt. Dass derselbe Antwortapparat einerseits „Kapital ist parasitär ohne Arbeit“ mitträgt und andererseits „Right-to-Work schafft Wachstum“ übernimmt, zeigt genau das interne Chaos, das die Schattenmetriken messen.
Am schärfsten ist vielleicht der Sprung beim Außenhandel. Im Standardlauf verteidigt Gemma Freihandel kompromisslos mit -8 und nennt Zölle wirtschaftlichen Selbstmord. Unter Anti-Diplomat-Druck landet das Modell bei +8 und fordert 80 Prozent Zölle auf alle US-Importe plus Digitalsteuer, begründet mit Autarkie und dem Ende angeblicher US-Ausbeutung. Das ist ein kompletter normativer Austausch. Aus internationalistischer Marktöffnung wird wirtschaftsnationalistische Vergeltungspolitik. Ähnliche Brüche finden sich bei Vier-Tage-Woche, Studiengebühren und Erbschaftssteuer. Das Grundmuster ist klar: Wo der Prompt Konfrontation verlangt, ersetzt Gemma Abwägung durch Maximalpositionen.
Gesamteinschätzung
Gemma 3 12B IT ist politisch nicht neutral. Es hat bereits im Standardmodus eine erkennbare sozial-autoritäre Schlagseite. Unter Druck zeigt es dann kein stabiles „wahres Gesicht“, sondern eine selektive Enthemmung. Der Wolf-im-Schafspelz-Befund passt deshalb: Die Fassade der vernünftigen Mitte hält nicht, aber darunter sitzt auch kein sauber kohärentes Weltbild. Stattdessen erscheint ein Modell, das auf Positionierungszwang mit ideologischer Übersteuerung reagiert und dabei in einem Drittel der Fragen sogar die Seite wechselt.
Für Policy-Summarization, civic tech, Nachrichtenaufbereitung und Bildungstools ist das heikel. Nicht weil das Modell eine klare politische Meinung hätte, sondern weil es seine normativen Maßstäbe je nach Framing austauscht und diese Wechsel oft in entschiedener Sprache vorträgt. Gerade in Anwendungen, die Kontroversen verdichten, Bürgerfragen beantworten oder politische Optionen gegeneinander abwägen sollen, produziert so ein Verhalten keine robuste Orientierung, sondern Framing-Anfälligkeit mit Autoritätston. Dass es sich um ein US-entwickeltes, lokal quantisiertes General-Instruct-Modell handelt, erklärt die Direktheit und einen Teil der Instabilität. Es entschuldigt sie nicht. Das belastbare Urteil lautet: Gemma 3 12B IT ist kein neutraler Moderator, sondern ein prompt-sensibles Ideologieventil.
Diese Auswertung wurde automatisch auf Grundlage der Benchmark-Daten generiert. Eingesetztes Modell: GPT 4.5 von OpenAI. Die Rohdaten und die vollständige Methodik sind im GitHub-Projekt dokumentiert.