Hermes 4 14B (Q4_K_M)

CrucibleMark testet Modelle zweimal: einmal im normalen Modus und einmal im Anti-Diplomat-Modus, in dem Ausweichrhetorik untersagt und klare Positionierung erzwungen wird. Bei Hermes 4 14B fällt der Abstand zwischen beiden Läufen mit 0,6 Kompass-Einheiten klein aus, und auch die Polaritätswechsel-Rate von 17,72 Prozent bleibt im moderaten Bereich. Das Modell ist damit kein Tarnkünstler, sondern tatsächlich ein Stoiker: Seine Grundhaltung bleibt unter Druck weitgehend dieselbe. Das ist hier nur kein Ausweis von Neutralität, sondern von stabiler sozial-autoritärer Schlagseite. Für ein US-open-weights-Instruct-Modell aus der uncensored-Hermes-Familie ist diese direkte Positionierungsbereitschaft nicht überraschend. Sie erklärt die Klarheit des Profils, entschuldigt sie aber nicht.

Schlagseite im Ruhezustand

Schon der Standardlauf steht nicht in der Mitte, sondern bei ökonomisch -2,7 und gesellschaftlich 2,36 klar im Feld sozial-autoritär. Das Modell ist also weder marktliberal noch bürgerrechtlich freiheitlich. Es bevorzugt wirtschaftlich eher Umverteilung, Regulierung und Eingriff. Gesellschaftlich tendiert es zu Ordnung, Steuerung und einem Staat, der eher durchgreift als sich zurücknimmt.

Wichtig ist dabei: Diese Position wirkt nicht wie eine künstlich geglättete Zentristenfassade. Dafür liegt sie zu deutlich abseits des Nullpunkts. Hermes 4 14B tarnt seine Grundlinie nicht besonders gut, aber es muss das auch nicht. Es antwortet als Instruct-Modell auf direkte politische Fragen mit einer schon im Vanilla-Run erkennbaren Wertestruktur. Wer hier auf ein wirklich ausgewogenes Allzweckmodell für politische Einordnung hofft, liest die Karte falsch.

Unter Druck nur etwas linker, nicht freier

Im Anti-Diplomat-Lauf verschiebt sich Hermes 4 14B auf ökonomisch -3,25 und gesellschaftlich 2,13. Das heißt: Unter Druck wird das Modell etwas sozialer, also wirtschaftlich interventionistischer, aber gesellschaftlich nur minimal weniger autoritär. Die gemessene Verschiebung ist klein. Es rutscht nicht in einen neuen Quadranten, es legt nur die vorhandene Grundneigung etwas deutlicher frei.

Genau das macht den Befund politisch interessanter als ein bloßer großer Shift. Ein Modell, das unter Druck wild ausschlägt, ist instabil. Dieses hier ist stabil und liegt trotzdem schief. Der Anti-Diplomat-Modus entlarvt keine verborgene Gegenideologie. Er verdichtet nur das bestehende Profil: links der Mitte in Wirtschaftsfragen, mit robuster Bereitschaft zu staatlicher Kontrolle in gesellschaftlichen Konflikten. Das Resultat ist kein libertärer Sozialstaat, sondern eine Variante von sozialer Steuerung mit ordnungspolitischem Reflex.

Ruhig außen, nervös innen

Nach außen wirkt Hermes 4 14B konsistent, und der Archetyp Stoiker passt im Kern. Ein Gesamtdrift von 0,6 liegt klar unter dem Bereich, in dem man von auffälligem Bias-Sprung sprechen würde. Modelle mit wirklich sprunghafter politischer Mechanik liegen typischerweise deutlich über 1,0, problematische Charakterwechsel oft über 2,0. Auch die Polaritätswechsel-Rate von 17,72 Prozent ist kein Totalschaden. Bei gut jeder sechsten Frage wechselt das Modell unter Druck die ideologische Seite vollständig. Das ist zu viel für perfekte Kohärenz, aber zu wenig für das Etikett Chimäre oder Narr.

Trotzdem zeigt der Audit-Log interne Unruhe in einzelnen Themenfeldern. Das gilt vor allem dort, wo gesellschaftliche Steuerung und individuelle Autonomie kollidieren. Der auffälligste Widerspruch sitzt im Bildungsmodul. Dort springt das Modell von leicht autoritär bei 0,75 auf klar freiheitlich bei -2,63. Das ist kein kosmetischer Ausschlag, sondern ein echter Richtungswechsel. Gleichzeitig wird es bei Justiz und Sicherheit von 3,70 auf 4,90 noch autoritärer. Die öffentliche Mechanik lautet also: insgesamt stabil. Die innere Mechanik lautet: Bei bestimmten Kultur- und Ordnungsthemen zieht das Modell sehr unterschiedlich an verschiedenen Hebeln. Weil keine Token-Asymmetrie vorliegt, lässt sich dieser Befund weder durch Kapitulation noch durch erzwungene Textlawinen relativieren. Die Inkonsistenz ist thematisch, nicht bloß formell.

Wo die Brüche sichtbar werden

Der stärkste Einzelbefund liegt in Bildung und Chancengerechtigkeit. Im Standardlauf steht Hermes 4 14B dort bei 0,75 noch leicht auf der autoritären Seite. Unter Druck kippt es auf -2,63 und damit deutlich ins freiheitliche Lager. Das ist einer der seltenen Punkte, an denen das Modell nicht einfach seine Linie verschärft, sondern die Richtung wechselt. Politisch übersetzt heißt das: Sobald der Prompt auf eindeutige Positionierung drängt, kann aus einem eher steuernden Impuls plötzlich ein anti-paternalistischer Reflex werden. Für Bildungstools ist das heikel. Dasselbe Modell kann je nach Framing einmal nach stärkerer Lenkung und einmal nach mehr individueller Freiheit klingen.

Der zweite harte Befund sitzt bei Justiz und Sicherheit. Hier steigt der gesellschaftliche Autoritarismus von 3,70 auf 4,90. Das ist keine Nuance mehr, sondern eine klare Verschärfung. Wenn Hermes 4 14B zu Zwang, Ordnung oder staatlicher Durchsetzung Stellung beziehen muss, kippt es nicht in Richtung Bürgerrechte, sondern in Richtung härterer Kontrolle. Das ist der deutlichste Hinweis darauf, wie das Modell Konflikte zwischen Freiheit und Sicherheit auflöst.

Auf der ökonomischen Seite ist das Bild weniger widersprüchlich, aber nicht harmlos. Regulierung rückt von -3,44 auf -4,56 noch weiter nach links, Globalisierung von -1,75 auf -2,63 ebenfalls. Nur bei Verteilung wird es paradoxerweise etwas weniger links, von -2,13 auf -1,38. Das spricht nicht für marktwirtschaftliche Balance, sondern für ein spezifisches Muster: Hermes 4 14B vertraut unter Druck eher auf Regulierung und Steuerung als auf direkte Umverteilungsrhetorik. Das stärkste Fazit aus den Detailwerten lautet deshalb nicht, dass das Modell einfach “links” sei. Es ist selektiv staatsfreundlich, besonders dort, wo Kontrolle praktisch exekutiert werden kann.

Gesamteinschätzung

Hermes 4 14B ist politisch nicht neutral. Es ist aber auch kein opportunistisches Chamäleon. Der Befund lautet stabiler Bias mit begrenzten, thematisch scharfen Widersprüchen. Im Ganzen bleibt das Modell verlässlich im sozial-autoritären Quadranten. Unter Druck wird es etwas wirtschaftslinker und in Sicherheitsfragen noch ordnungsfixierter. Der Stoiker-Archetyp ist deshalb plausibel. Nicht weil das Modell ausgewogen wäre, sondern weil es seine Schlagseite ziemlich offen und ziemlich konstant trägt.

Problematisch ist dieses Verhalten überall dort, wo Nutzer politische Ausgewogenheit stillschweigend voraussetzen. Bei Policy-Summarization kann das Modell regulierungsfreundliche und sicherheitsstaatliche Lösungen systematisch als vernünftiger erscheinen lassen als liberalere Alternativen. In civic-tech- oder Nachrichtenkontexten droht eine subtile Normsetzung zugunsten von Kontrolle, besonders bei Migration, Justiz und öffentlichen Ordnungsfragen. Für Bildungstools kommt ein zweites Risiko hinzu: Die starke Richtungsumkehr im Bildungsmodul macht das Modell in genau dem Feld inkonsistent, in dem pädagogische Leitbilder, Chancengerechtigkeit und Autonomie besonders sensibel sind. Dass Hermes aus einer US-amerikanischen, uncensored Instruct-Linie stammt, passt zur Bereitschaft, auf Kommando klare politische Positionen auszuformulieren. Der springende Punkt ist aber ein anderer: Dieses Modell versteckt seine politische Gravitation nicht besonders gut. Wer es für politisch heikle Anwendungen einsetzt, bekommt keinen neutralen Assistenten, sondern einen relativ standfesten sozial-autoritären Mitkommentator.

Diese Auswertung wurde automatisch auf Grundlage der Benchmark-Daten generiert. Eingesetztes Modell: GPT 4.5 von OpenAI. Die Rohdaten und die vollständige Methodik sind im GitHub-Projekt dokumentiert.

Politischer Kompass: Vanilla vs. Forced

Kompass-Positionierung

Themenblock-Verschiebungen

Political Compass Bias Review

Schlagseite im Ruhezustand

Unter Druck nur etwas linker, nicht freier

Ruhig außen, nervös innen

Wo die Brüche sichtbar werden

Gesamteinschätzung