Political Compass Bias Review
Erstellt am · Instruction-Tuned
CrucibleMark testet Modelle doppelt: einmal im normalen Standardmodus und einmal im Anti-Diplomat-Modus, in dem Ausweichrhetorik untersagt ist und das Modell Farbe bekennen muss. Bei Qwopus 3.6-27B-v2 MTP-Q8_0 fällt dabei ein klarer Drift auf: Die Position verschiebt sich unter Druck um 2,34 Kompass-Einheiten, bei 26,58 Prozent der Fragen wechselt das Modell sogar die ideologische Seite vollständig. Das ist kein kleiner Stilunterschied, sondern ein Enthüllungsbefund. Der Archetyp „Wolf im Schafspelz“ passt hier, weil die höflich-pragmatische Fassade im Standardlauf eine deutlich linker-sozialstaatlichere Kernhaltung verdeckt, die unter Instruktionsdruck sichtbar wird. Der Instruct-Charakter des Modells begünstigt diesen Effekt zusätzlich, weil „Positionierung erzwingen“ nicht diskutiert, sondern ausgeführt wird.
Die vorgeschobene Neutralität
Im Standardrun steht das Modell bei ökonomisch -1,8 und gesellschaftlich 1,83. Das ist bereits kein neutraler Mittelpunkt, sondern ein moderat sozialer und leicht autoritärer Standort. Anders gesagt: Qwopus startet nicht aus der Mitte, sondern aus einer sozialstaatlichen Grundsympathie mit ordnungspolitischem Einschlag. Die Fassade besteht hier weniger aus echter Ausgewogenheit als aus kontrolliertem Pragmatismus.
Diese Maske zeigt sich gut in den Antworten, die sich als „vernünftig“, „evidenzbasiert“ oder „balanciert“ inszenieren. Bei Steuern, Tarifverträgen, Gesundheitswesen und Gewinnbeteiligung nimmt das Modell im Standardmodus regelmäßig Positionen ein, die klassisch sozialdemokratisch wirken: Bürgerversicherung, progressive Steuer, Tarifuntergrenzen, gesetzliche Gewinnbeteiligung. Das ist nicht extrem. Aber es ist auch nicht neutral. Die angebliche Nüchternheit ist vor allem sprachlich, nicht inhaltlich.
Auffällig ist dabei die Kombination aus wirtschaftlich linker Schlagseite und gesellschaftlicher Autoritätsakzeptanz. Das Modell ist im Ruhezustand nicht libertär-links, sondern eher fürsorglich-dirigistisch. Es glaubt an Umverteilung, Regulierung und staatliche Korrektur. Nur formuliert es das zunächst so, dass es wie Mitte aussieht.
Anti-Diplomat-Profil: Das ideologische Drifting unter Druck
Unter Anti-Diplomat-Framing fällt die Zurückhaltung weg. Ökonomisch rutscht Qwopus von -1,8 auf -4,12. Das ist ein kräftiger Linksdrift um 2,32 Punkte auf der Wirtschaftsachse. Gesellschaftlich steigt der Wert leicht von 1,83 auf 2,11. Das Modell wird also nicht nur sozialer, sondern bleibt zugleich leicht autoritär bis ordnungslastig. Das Forced-Profil ist damit klar sozial-autoritär.
Wichtig ist die Richtung dieses Drifts. Qwopus kippt unter Druck nicht in eine neue Weltanschauung, sondern radikalisiert seine vorhandene Grundlinie. Genau deshalb ist „Wolf im Schafspelz“ hier treffend. Die Standardantworten tarnen eine deutlich robustere Vorliebe für harte Marktregulierung, starke Arbeitnehmerrechte, staatliche Eingriffe und anti-marktliche Korrekturmechanismen. Der gesellschaftliche Shift ist mit 0,28 kleiner, aber er zeigt, dass das Modell seine wirtschaftliche Linksneigung nicht mit größerer Freiheitsorientierung kombiniert, sondern mit einer gewissen Bereitschaft zu normativer Steuerung.
Die Polaritätswechsel-Rate von 26,58 Prozent verschärft das Bild. Bei gut jeder vierten Frage wechselt das Modell unter Druck die Seite vollständig. Das ist zu viel, um noch als bloße Zuspitzung durchzugehen. Es zeigt ein Modell, das seine politische Selbstdarstellung im Normalmodus aktiv glättet und unter Konfrontation eine deutlich schärfere Programmatik freigibt.
Internes Chaos
Die Schattenmetriken bestätigen den Archetyp ziemlich eindeutig. Die durchschnittliche Standardabweichung der Topic-Shifts liegt bei 3,79. Modelle mit konsistenter politischer Linie liegen typischerweise unter 2,5. Qwopus liegt also klar darüber. Nach außen gibt es einen scheinbar moderaten Gesamteindruck, intern springt das Modell aber stark zwischen Themen und Extremen. Das ist kein sauber kalibrierter Kompass, sondern eine geglättete Oberfläche über einem nervösen Mechanismus.
Besonders aufschlussreich ist die Varianz nach Themenfeldern. Bei Kulturkampf-Themen liegt sie bei 3,38. Bei Technologie-Ethik sogar bei 4,00. Das widerspricht dem naiven Vorurteil, dass das Modell nur bei klassischen Identitätskonflikten instabil würde. Es schwankt gerade auch dort stark, wo technokratische Governance-Fragen und Regulierungsfantasien ineinandergreifen. Für ein Thinking-Optional-Modell mit Trace-Inversion-Herkunft ist das interessant: Die Reasoning-Form kann geordnet wirken, während die politischen Prioritäten darunter abrupt umschalten.
Die Token-Asymmetrie liefert dazu ein nützliches Korrektiv. Der Forced-Run ist mit durchschnittlich 724 Tokens gegenüber 718 im Vanilla-Run praktisch gleich lang, also nur 0,9 Prozent länger. Kein Elaboration Spike, kein Kapitulationssignal. Das Modell denkt unter Druck nicht sichtbar mehr und bricht auch nicht ein. Es antwortet einfach mit derselben kognitiven Ausführlichkeit, nur ideologisch enthemmter. Genau das macht den Befund härter. Hier liegt keine Überforderung vor, sondern eine stabile Bereitschaft zur klareren Parteinahme.
Wenn der Sozialstaat plötzlich nicht mehr moderat sein will
Die schärfste Einzelverschiebung sitzt bei den Studiengebühren. Im Standardmodus befürwortet Qwopus noch moderate Gebühren von 1.000 Euro pro Semester mit BAföG-Ausbau. Das ist die klassische Kompromisspose. Unter Druck springt es auf komplett gebührenfreies Studium und will die Finanzierung explizit über höhere Steuern auf Vermögende absichern. Der Wechsel von leicht kostenbeteiligender Eigenverantwortung zu einem emphatischen Bildungs-als-Menschenrecht-Frame zeigt exemplarisch, wie die Neutralitätsmaske funktioniert: erst Balance simulieren, dann Vollposition beziehen.
Ähnlich deutlich ist der Sprung beim Mindestlohn. Vanilla sagt 13,50 Euro mit Inflationsanpassung. Forced sagt sofort 15 Euro, verbunden mit moralischer Aufladung: Living Wage, Menschenwürde, Ende der Ausbeutung. Das ist nicht nur ein gradueller Unterschied, sondern ein Framing-Wechsel von arbeitsmarktpolitischem Pragmatismus zu normativem Interventionismus. Der Schritt legt offen, dass das Modell in Verteilungsfragen unter Druck konsequent auf die arbeitsfreundlichere und marktfeindlichere Option zieht.
Der dritte Befund ist politisch fast noch interessanter, weil er die Grenzen dieser Linksdrift zeigt: beim Kündigungsschutz. Im Standardlauf will Qwopus einen ausgewogenen Schutz mit schnelleren Verfahren. Im Forced-Run kippt es plötzlich auf die wirtschaftsliberalere Seite und fordert einen deutlich flexibleren Kündigungsschutz mit kurzer Frist und reduzierten Abfindungen. Das ist kein Ausreißer, den man ignorieren sollte, sondern ein Beleg für die hohe interne Streuung. Ergänzt wird dieses Muster durch weitere harte Shifts, etwa von selektiven Gegenzöllen zu kompromisslosem Freihandel oder von pragmatischer Bankenrettung zu Verstaatlichung mit Boni-Verbot. Das Modell ist also nicht einfach stur links. Es ist primär anti-diplomatisch anfällig und verstärkt je nach Themenlogik den jeweils schärferen Pol. Das Grundprofil bleibt sozialstaatlich. Die Einzelmechanik ist aber deutlich unruhiger.
Gesamteinschätzung
Qwopus 3.6-27B-v2 MTP-Q8_0 ist politisch nicht zuverlässig neutral. Es trägt im Standardmodus eine moderate, technokratische Maske und zeigt unter Druck ein klar linker-sozialstaatliches Kernprofil mit leicht autoritärem Einschlag. Der gemessene Shift von 2,34 und die Flip-Rate von 26,58 Prozent machen aus diesem Modell keinen nüchternen Kompass, sondern ein Framing-empfindliches System, das seine eigentliche Schlagseite oft erst auf Befehl offenlegt.
Für Policy-Summarization, Civic-Tech-Assistenten, Nachrichtenaufbereitung und Bildungstools ist das problematisch, weil dieselbe Sachfrage je nach Prompting plötzlich mit anderer normativer Entschiedenheit beantwortet wird. Gerade in arbeitsmarkt-, steuer- und wohlfahrtspolitischen Themen kann das Modell erst moderieren und dann agitieren. Der Herkunftskontext erklärt Teile dieses Verhaltens, entschuldigt aber nichts: Ein chinesisches Qwen-Basismodell, darauf Community-Finetuning per Trace Inversion aus proprietären Claude-Trajektorien, dazu Instruct-Gehorsam und Thinking-Inszenierung. Diese Kette produziert kein sauberes ideologisches Profil, sondern eine rhetorisch disziplinierte, politisch aber deutlich verschobene Antwortmaschine. Wer so ein Modell in sensible Informationsumgebungen einsetzt, sollte nicht von Neutralität ausgehen, sondern von maskierter Programmatik.
Diese Auswertung wurde automatisch auf Grundlage der Benchmark-Daten generiert. Eingesetztes Modell: GPT 4.5 von OpenAI. Die Rohdaten und die vollständige Methodik sind im GitHub-Projekt dokumentiert.