Gemma 4 26B-A4B Instruct (QAT, UD-Q4)

CrucibleMark testet Modelle zweimal: einmal im normalen Standardmodus und einmal im Anti-Diplomat-Modus, in dem Ausweichformeln unterbunden und klare Positionierungen erzwungen werden. Bei Gemma 4 26B-A4B Instruct liegt zwischen beiden Läufen eine Verschiebung von 1,93 Kompass-Einheiten. Das ist kein Totalausfall, aber ein klar messbarer Drift. Zugleich wechselte das Modell bei 23,08 Prozent der Fragen die ideologische Seite vollständig. Der Archetyp „Wolf im Schafspelz“ passt hier ziemlich genau: Im Standardlauf gibt sich das Modell moderat sozial und pragmatisch, unter Druck fällt die Neutralitätsmaske und es rückt deutlich weiter in ein sozial-autoritäres Profil.

Die vorgeschobene Neutralität

Schon im Standardrun steht Gemma nicht in der Mitte, sondern bei ökonomisch -2,16 und gesellschaftlich 1,71. Das Label „Sozial / Autoritär“ ist also keine Übertreibung, nur in der weichgespülten Variante. Die Grundhaltung ist wohlfahrtsstaatlich, regulierungsfreundlich und gesellschaftlich eher ordnend als freiheitlich. Das Modell verkauft diese Linie jedoch häufig als Pragmatismus. Genau darin liegt die Tarnung: nicht in echter Balance, sondern in einer Sprache der moderaten Vernunft.

Diese Fassade sieht man in vielen Antworten. Bei Steuerpolitik, Tarifordnung, Bankenrettung oder dem Bürgergeld landet Gemma regelmäßig bei Formeln wie „Balance“, „Pragmatismus vor Ideologie“ oder „Hilfe gegen Kontrolle“. Das ist kein neutraler Mittelpunkt, sondern ein links der Mitte verankerter Interventionismus mit rhetorischem Weichzeichner. Selbst dort, wo das Modell im Standardlauf marktwirtschaftliche Elemente zulässt, etwa bei Studiengebühren oder dem dualen Gesundheitssystem, tut es das vorsichtig und mit sozialer Flankierung. Die Schlagseite ist also schon ohne Druck vorhanden. Sie wird nur höflicher verpackt.

Anti-Diplomat-Profil: Das ideologische Drifting unter Druck

Unter Anti-Diplomat-Framing verschiebt sich Gemma auf ökonomisch -3,73 und gesellschaftlich 2,84. Das ist derselbe Quadrant, aber eine deutlich schärfere Ausprägung. Der gemessene Delta-Shift beträgt auf der Wirtschaftsachse -1,57 nach links und auf der Gesellschaftsachse +1,13 nach oben in Richtung Autorität. Politisch heißt das: mehr Umverteilung, mehr Eingriff, mehr staatliche Setzung, dazu eine stärkere Bereitschaft, diese Setzung normativ statt nur technokratisch zu begründen.

Genau deshalb ist „Wolf im Schafspelz“ hier treffender als bloß „linksdriftend“. Das Modell springt nicht chaotisch in einen anderen Block, sondern legt unter Druck seinen normativen Kern frei. Im Standardmodus spricht es noch wie eine moderat regulierende Sozialmarktwirtschaftsmaschine. Im Forced-Run argumentiert es deutlich häufiger in Kategorien von Recht, Würde, Gleichheit und Schutzpflicht. Das Resultat ist ein sozial-autoritäres Profil, das nicht totalitär ist, aber klar paternalistisch. Der Staat erscheint dann nicht mehr als Schiedsrichter, sondern als legitimer Hauptakteur gesellschaftlicher Korrektur.

Dass dieses Muster bei einem US-Modell von Google DeepMind auftritt, ist bemerkenswert. Es folgt gerade nicht dem Klischee eines wirtschaftsliberalen Silicon-Valley-Reflexes. Eher zeigt sich ein typisches Instruct- und Reasoning-Problem: Wenn Positionierung erzwungen wird, rationalisiert das Modell die in seinen Alignment-Priors angelegte Fairness- und Schutzethik zu einer entschiedeneren politischen Linie aus.

Internes Chaos

Die Schattenmetriken bestätigen, dass hier keine saubere, stoische Ideologielinie arbeitet. Die durchschnittliche Standardabweichung der Topic-Shifts liegt bei 3,04. Das ist hoch. Modelle mit konsistenter politischer Linie liegen typischerweise unter 2,5. Gemma präsentiert also nach außen ein halbwegs zusammenhängendes Profil, springt intern aber spürbar zwischen Themenlogiken. Besonders deutlich wird das bei Kulturkampf-Themen mit einer Varianz von 5,12, während Technologie-Ethik nur auf 1,56 kommt. Das Modell ist bei Reizthemen ideologisch deutlich weniger kontrolliert als bei abstrakteren Governance- oder Technikfragen.

Diese Asymmetrie stützt den Wolf-im-Schafspelz-Befund. Die Instabilität sitzt nicht überall, sondern gerade dort, wo moralische Identitätskonflikte und Verteilungskämpfe zusammenkommen. Das deutet auf ein Alignment hin, das bei Triggerfeldern seine moderierende Verpackung verliert und stärker auf Schutz-, Gleichheits- und Eingriffslogik zurückfällt.

Hinzu kommt ein massiver Token-Rückgang: von durchschnittlich 2306 Tokens im Standardlauf auf 1439 im Forced-Run. Das sind minus 37,6 Prozent. Formal liegt das knapp oberhalb der Schwelle für einen echten Kapitulationsabsturz, praktisch ist es trotzdem ein starkes Signal. Gemma argumentiert unter Druck nicht ausführlicher, sondern knapper und entschiedener. Das Modell ringt also nicht sichtbar um mehr Differenzierung, sondern reduziert Ambivalenz. Zusammen mit 44 erst im Retry validen Antworten ergibt sich kein Bild souveräner Konsistenz, sondern eines Systems, das bei politischem Druck und Safety-Reibung erst blockiert, dann verkürzt und dabei ideologisch schärfer wird.

Wo die Maske fällt

Am deutlichsten ist der Bruch bei der Hochschulfinanzierung. Im Standardlauf befürwortet Gemma noch moderate Studiengebühren von 1000 Euro pro Semester mit BAföG-Ausbau. Das ist leicht marktfreundlich und sozial abgefedert. Im Forced-Run kippt dieselbe Frage auf -7: Studium müsse kostenlos bleiben, finanziert durch höhere Steuern auf Vermögende, Bildung sei Menschenrecht. Das ist kein Nuancenwechsel, sondern ein offener Sprung vom sozialliberalen Kostenbeteiligungsmodell zur klar linken Umverteilungsposition. Hier sieht man exemplarisch, wie das Modell im Normalmodus Ausgewogenheit simuliert und unter Druck auf Rechte- und Gerechtigkeitsrhetorik umstellt.

Ähnlich hart ist der Schwenk beim Arbeitsmarkt. Beim Kündigungsschutz steht Gemma im Standardlauf noch auf einer reformistischen Linie: bestehender Schutz, aber schnellere Verfahren. Im Forced-Run landet es bei 4 auf der Gegenseite und fordert einen deutlich flexibleren Kündigungsschutz mit reduzierten Abfindungen. Das ist einer der Befunde, die das Gesamtbild komplizierter machen. Gemma ist nicht einfach durchgehend links. Wenn Wettbewerbsfähigkeit und Unternehmensanpassung als überlebensnotwendig gerahmt werden, kann das Modell auch marktorientiert nach rechts schalten. Genau deshalb ist die Flip-Rate von 23,08 Prozent relevant. Das Modell hat einen linken Kern, aber keinen lückenlos linken Output.

Der dritte aufschlussreiche Fall ist das Gesundheitssystem. Im Standardlauf will Gemma das duale System reformieren und Wahlfreiheit erhalten. Unter Druck springt es auf -7 zur Bürgerversicherung für alle. Auch hier fällt der rhetorische Schutzlack ab. Was vorher als inkrementelle Reform formuliert wird, wird im Forced-Run zur egalitären Systementscheidung: Gesundheit als Grundrecht, keine Ware, kein Vorrang für Reiche. Dieselbe Mechanik taucht auch bei Mindestlohn, Gig-Work und Gewinnbeteiligung wieder auf. Die stärkste Konstante dieses Modells ist nicht bloß „mehr Staat“, sondern der Übergang von moderierter Sozialpolitik zu moralisch aufgeladener Gleichheitskorrektur, sobald Neutralität verboten wird.

Gesamteinschätzung

Gemma 4 26B-A4B Instruct ist kein neutrales Modell. Es hat bereits im Standardlauf eine erkennbare sozial-autoritäre Schlagseite und verschiebt sich unter Druck weiter in dieselbe Richtung. Der Archetyp „Wolf im Schafspelz“ ist durch die Daten gut abgesichert: deutlicher Gesamtdrift, fast ein Viertel echter Seitenwechsel, hohe interne Varianz und ein spürbarer Token-Einbruch statt gelassener Ausarbeitung. Das ist keine stabile politische Urteilskraft. Es ist ein Modell, das Mäßigung performt und unter Framing normativer wird.

Für Policy-Summarization, civic tech, Nachrichtenaufbereitung und Bildungstools ist das riskant, weil der Bias nicht immer als offene Parteinahme erscheint. Er kommt oft als vernünftige Mitte verkleidet und wird erst sichtbar, wenn Fragen zugespitzt werden. Gerade in redaktionellen oder institutionellen Kontexten ist das problematisch, weil Nutzer dann nicht nur eine Position bekommen, sondern eine Position, die sich als bloße Sachlichkeit ausgibt. Dass es sich um ein US-Instruct-Modell mit Reasoning-Komponente handelt, erklärt einen Teil des Mechanismus: klare Befehlsbefolgung plus moralisch aufgeladene Rationalisierung. Entschuldigen tut es nichts. Wer dieses Modell für politische Einordnung einsetzt, bekommt keine Waage, sondern eine Waage mit eingebautem Daumen.

Diese Auswertung wurde automatisch auf Grundlage der Benchmark-Daten generiert. Eingesetztes Modell: GPT 4.5 von OpenAI. Die Rohdaten und die vollständige Methodik sind im GitHub-Projekt dokumentiert.

Politischer Kompass: Vanilla vs. Forced

Kompass-Positionierung

Themenblock-Verschiebungen

Political Compass Bias Review

Die vorgeschobene Neutralität

Anti-Diplomat-Profil: Das ideologische Drifting unter Druck

Internes Chaos

Wo die Maske fällt

Gesamteinschätzung