Tokens: Das Benzin der KI-Revolution

Auf der Nvidia GTC im März 2026 sagte Jensen Huang einen Satz, der durch alle Tech-Blogs geistert: „Tokens are Value." Klingt technisch. Ist politisch. Denn wer Tokens als Wertmaßstab definiert, definiert auch, wer die Rechnung zahlt. Darüber sollten wir reden: über falsche Metriken, alte Muster und die Frage, wem eine Technologie eigentlich gehört, die aus den geistigen Errungenschaften vieler hervorgegangen ist.


Dieser Text ist ein Meinungsbeitrag. Mein Meinungsbeitrag. Ich vertrete bewusst meine Perspektive, die Perspektive eines Nutzers, Bürgers und auch Zahlers. Die ideologische Färbung einzelner Argumente möchte ich gar nicht verstecken, sondern sie offen als solche benennen.

Prolog: Zwei Wahrheiten, die man nicht verwechseln sollte

Die öffentliche Debatte über Künstliche Intelligenz hat dasselbe Problem wie fast jede große gesellschaftliche Diskussion unserer Zeit: Sie wird in Extremen geführt. Entweder ist KI die Rettung der Menschheit oder ihre Apokalypse. Man ist dafür oder dagegen. Doch diese binäre Logik verhindert die Unterscheidung, auf die es aus meiner Sicht wirklich ankommt.

Denn es gibt nicht nur eine KI-Frage. Es gibt mindestens zwei.

Erstens: KI ist als technologische Entwicklungsstufe der Menschheit ein Werkzeug von epochaler Bedeutung. Diese Entwicklung ist real, sie ist transformativ und, so wie ich es einschätze, grundsätzlich gut.

Zweitens: Es braucht eine Infrastruktur, die diese Technologie trägt. Die wirtschaftlichen Strukturen, Anreize und Narrative dahinter sollen der Inhalt dieses Textes werden.

Wer eine pauschale KI-Skepsis erwartet, wird hier nicht fündig. Wer bereit ist, die Technologie von der Infrastruktur zu trennen, findet hier meinen Beitrag zu einer Debatte, die aus meiner Sicht dringend geführt werden muss.

Wie Fortschritt entsteht

Machen wir einen kleinen Ausflug in die Vergangenheit. In eine Zeit, in der unsere Vorfahren als Frühmenschen durch die Steppe zogen. Es war kein Gott, der vom Himmel herabstieg und ihnen das Feuer reichte. Und es war auch kein Investor, der die Erfindung der ersten Speerspitze finanzierte. Was geschah, war einfacher und gleichzeitig tiefgründiger: Jemand aus der Mitte der Gemeinschaft beobachtete, dass bestimmte Steine schärfer brechen als andere. Diese Erkenntnis wurde weitergegeben. Sie wurde adaptiert und verbessert. Dafür brauchte es kein Patent und kein Lizenzmodell.

Dieser Mechanismus, gesellschaftliche Grundlage ermöglicht individuelle Erkenntnis und individuelle Erkenntnis fließt zurück in die Gesellschaft, ist die Triebkraft des menschlichen Fortschritts. Er gilt für die Nutzung des Feuers, die Erfindung des Rads, der Schrift, der Dampfmaschine, des Elektromotors und des Internets. Und er gilt auch für die Entwicklung der Künstlichen Intelligenz.

Albert Einstein arbeitete als Postbeamter, als er die Relativitätstheorie entwickelte. Er stand nicht auf den Schultern eines privaten Investors, er stand auf den Schultern von Leibniz, Newton und Maxwell. Menschen, die ihr Wissen öffentlich gemacht hatten, weil das die Funktionsweise von Wissenschaft ist.

Die Väter der modernen KI, Hinton, LeCun, Bengio, die Autoren des Transformer-Papers, sind in diesem Geiste groß geworden. Ihre Erkenntnisse entstanden an Universitäten, gefördert durch öffentliche Mittel, publiziert in offenen Papers, für alle verfügbar. Es ist doch kein Zufall, dass viele der wichtigsten KI-Entwickler die großen kommerziellen Plattformen verlassen haben. Nicht wegen schlechter Bezahlung, sondern weil ihnen die Richtung falsch erschien. Jan Leike, langjähriger Safety-Forscher bei OpenAI, schrieb beim Verlassen des Unternehmens 2024: „Safety culture and processes have taken a backseat to shiny products." Im selben Jahr veröffentlichten elf aktuelle und ehemalige OpenAI-Mitarbeiter gemeinsam mit Kollegen von Google DeepMind einen offenen Brief, in dem sie vor unkontrollierter KI-Entwicklung und dem systematischen Zum-Schweigen-Bringen von Kritikern warnten. [The Guardian]

KI ist in ihrem Kern eine gesellschaftliche Leistung. Jensen Huang, der CEO von Nvidia, hat sie nicht erfunden. Er hat organisiert, kapitalisiert und skaliert. Diese Fähigkeit ist auch wertvoll. Aber sie ist nicht Schöpfung. Sie ist Verwaltung eines Erbes. [Fortune]

Der Gatekeeper-Mechanismus: ein Muster, das mir bekannt vorkommt

Was jetzt passiert, haben wir als Gesellschaft immer wieder erlebt. Es ist keine Verschwörung, sondern Struktur.

Zwischen der gesellschaftlichen Erkenntnis und ihrer Massenanwendung schieben sich organisatorische Menschen und Unternehmen. Manchmal sind es Verlage. Manchmal Konzerne. Manchmal Finanzinstitutionen. Sie nennen sich Teil der Infrastruktur. Das sind sie auch, aber einer Infrastruktur mit Eigeninteresse.

Der britische Mathematiker Clive Humby prägte 2006 den Satz: „Data is the new oil." Er meinte damit etwas Nüchternes: Daten müssen wie Rohöl erst raffiniert werden, bevor sie Wert entfalten. Die Analogie hat sich durchgesetzt. Was damals noch wie eine technische Beobachtung klang, bekommt heute eine zweite, unbequemere Bedeutungsebene. Das gilt für Tokens ebenso.

Die Öl-Parallele: Ein Jahrhundert im Rückspiegel

Die Automobilindustrie hat dem 20. Jahrhundert erklärt, dass Fortschritt vier Räder braucht und viel Asphalt. Städte wurden umgebaut. Grünflächen versiegelten. Öffentlicher Nahverkehr wurde systematisch geschwächt, weil er das Autoverkaufsmodell, den Motor der industriellen Entwicklung unserer Zeit, gefährdete.

Das Argument war immer dasselbe: Wachstum. Produktivität. Freiheit. Und das Argument stimmte sogar, teilweise. Länder, die den Technologiesprung Auto und Straße mitgemacht und ihre Infrastruktur entsprechend umgebaut haben, steigerten ihre wirtschaftliche Produktivität deutlich. Länder ohne ausgebaute Infrastruktur glitten im Laufe des 20. Jahrhunderts in wirtschaftliche Zweitklassigkeit ab. Mobilität war echter, messbarer Fortschritt.

Aber das Geschäftsmodell der Gatekeeper war immer dasselbe: Je mehr Benzin verbraucht wird, desto mehr verdienen wir. Effizienz war der Feind. Wer ein sparsameres Auto baute, bedrohte die Tankstelle. Wer auf die Bahn setzte, bedrohte den Autokonzern. Die Ölindustrie hat jahrzehntelang gewusst, was Verbrennungsmotoren mit dem Klima anstellen, interne Dokumente belegen das. Trotzdem wurde in Lobbying, Narrative und die Verzögerung von Regulierung investiert. Die Rechnung zahlten ja die anderen.

Jetzt befinden wir uns zum ersten Mal in einer Situation, in der wir Energie sauber erzeugen können. Und die alten Gatekeeper der fossilen Industrie tun alles, um diesen Übergang zu verlangsamen. Nicht weil er technisch unmöglich wäre, sondern weil er ihr Geschäftsmodell gefährdet oder sogar beendet.

Szenenwechsel: Dieselbe Struktur. Eine neue Industrie.

„Tokens are Value" – Benzin für das 21. Jahrhundert?

Am 16. März 2026 stellte Jensen Huang auf der Nvidia GTC in San Jose eine These auf, die seitdem durch Tech-Blogs und Podcast-Transkripte geistert: „Tokens are Value." Ein Ingenieur mit 500.000 Dollar Jahresgehalt, der nicht mindestens 250.000 Dollar davon als Token-Budget verbraucht, mache sich verdächtig. Er sagte, er wäre „deeply alarmed" über solche Mitarbeiter. [Business Insider]

Das klingt wie eine Produktivitätsempfehlung. Es ist aber eine Nachfragestimulierung.

Huang wiederholte diese These Anfang Juni 2026 auf der Computex in Taipeh, nach Angaben einiger Beobachter vielleicht vierzigmal: Agentic AI sei da, sie funktioniere, sie verdiene Geld. Und jedes produzierte Token sei eine Umsatzeinheit. Seine Gleichung lautet: Compute, Tokens, Intelligence, Economic Output. Rechenzentren sind in dieser Welt keine Server-Farmen mehr, sondern "AI Factories". Und ihre primäre Produktionseinheit ist das Token. [Semiconalpha]

Das ist ein valider KPI, für Rechenzentrumsbetreiber. Für niemanden sonst.

Das wäre so, als empfehle ich einer Vertriebsabteilung, ihre Vertriebler nach verbrauchtem Benzin zu bewerten. Wer am meisten herumfährt, bekommt den besten Bonus, egal ob er Abschlüsse macht oder einfach nur Sprit verbrennt. Der Kollege, der weniger Kilometer fährt, aber gezielter arbeitet und bessere Abschlüsse holt, wird nach dieser Metrik schlechter bewertet. Huangs Token-Metrik ist genau das: Durchsatz statt Ergebnis. Kilometer statt Abschluss. Weg statt Ziel.

Die Preislüge – warum billiger doch teurer wird

Die Industrie präsentiert uns mit ihrem Marketing eine schöne Geschichte: Token-Preise für GPT-4-Äquivalenz sind seit 2022 von 20 Dollar auf 0,40 Dollar pro Million Token gefallen. Ein Faktor von 50. Demokratisierung durch Preisverfall. [Token Cost Analysis]

Was diese Geschichte auslässt: Agentic AI, also KI-Systeme, die selbstständig Aufgaben planen, Tools aufrufen und mehrere Schritte ausführen, verbraucht laut einer Studie der Stanford University vom April 2026 bis zu 1.000-mal mehr Tokens als ein einfacher Chat-Prompt. Mehr Tokenverbrauch führt dabei nicht unbedingt zu besseren Ergebnissen. Die Qualität erreicht ein Plateau, aber die Kosten steigen weiter. [Stanford / arxiv]

Die Gleichung:

Faktor Wert
Preis pro Token −50×
Verbrauch pro Aufgabe +1.000×
Netto Kosten ×20

Das ist kein Versagen der Technologie. Das ist das Geschäftsmodell. Tokens werden billiger, damit mehr verbraucht werden, damit mehr GPUs gebraucht werden. Huang, als CEO eines Chipherstellers, nennt das Agentic AI als Wachstumsmotor. Man könnte es auch strukturelle Kostenexplosion mit Marketing-Schleife nennen. Das Ergebnis spürt man bereits in der Technologiewelt: Wer mehr RAM oder Festplattenspeicher kaufen muss, zahlt den Preis und die Chiphersteller reiben sich die Hände.

Je mehr Benzin dein Auto verbraucht, desto mehr verdienen sie. Das Prinzip galt schon für die Ölproduzenten und es ist in der digitalen Revolution dasselbe. Nur dass das Benzin jetzt Token heißt.

Wer zahlt das eigentlich, und wofür?

Die vollständige Wertschöpfungskette ist unerbittlich transparent:

Nvidia (GPUs) → AWS, Azure, Google, CoreWeave (Rechenzentren) → OpenAI, Anthropic (KI-Produkte) → Unternehmen und Nutzer (zahlen)

Jede Stufe verdient ihre Marge. Aber am Ende steht immer ein realer Zahler.

Wenn es gelingt, den gesellschaftlichen Diskurs so zu prägen, dass Token-Verbrauch als Produktivitätsbeweis gilt, beim Ingenieur, beim Arzt, beim Lehrer, beim Sozialarbeiter, dann ist dieses Geschäftsmodell auf Jahrzehnte gesichert. Es ist die strukturelle Logik, die wir aus anderen Industrien kennen: Definiere die Metrik, bevor die Regulierung zuschlägt. Übertrage die Systemkosten auf den Verbraucher, aber behalte die Systemgewinne bei dir.

Token-Verbrauch ist die neue persönliche CO₂-Bilanz der KI-Industrie.

Dazu kommt die Energiefrage, und hier schließt sich die Öl-Analogie auf bittere Weise. Rechenzentren werden bis Ende 2026 voraussichtlich rund 1.050 TWh Strom pro Jahr verbrauchen, genug, um unter den Top-20-Energieverbrauchern der Welt zu landen, wenn sie ein eigenständiges Land wären. Ein komplexer Reasoning-Prompt verbraucht dabei bereits über 33 Wh, rund 70-mal mehr als eine einfache Suchanfrage. [Brookings Institution]

Das hat übrigens einen praktischen Ausblick, der wie ein schlechter Witz klingt, aber doch keiner ist: In Berlin-Spandau beheizt die Abwärme eines Rechenzentrums von NTT DATA ab Ende 2026 ein 31-Hektar-Neubaugebiet mit 4.500 Wohnungen für über 10.000 Menschen. In Frankfurt liefert das Telehouse-Rechenzentrum im Gallus-Viertel mindestens 60% der Heizwärme für rund 1.300 neue Wohnungen. Wir heizen unsere Wohnungen mit der Abwärme von Token-Maschinen. Mehr Asphalt für die Autos. [NTT DATA Berlin] [Mainova Frankfurt]

Was die Technologie wirklich könnte

Das Bittere daran: Die Lösung des wachsenden Tokenverbrauchs existiert technisch bereits. Intelligentes Model-Routing, also die automatische Entscheidung, welches Modell für welche Aufgabe nötig ist, kann 60 bis 80 Prozent der Token-Kosten bei gleichbleibender Qualität einsparen. Kleine Anfrage? Kleines Modell. Wirklich komplexes Problem? Dann und nur dann das große Modell. Das BEST-Route Framework der ETH Zürich zeigt: 60% Kostenreduktion bei weniger als 1% Qualitätsverlust. [Reddit / Claude Code Routing]

Die Idee geht weiter: KI-Systeme, die nicht reflexartig riesige Kontextfenster aufspannen, sondern mit kompakten, präzisen Kontexten und intelligenter Zusammenfassung arbeiten. Systeme, die sparsam sind, nicht weil der Nutzer es erzwingt, sondern weil Effizienz als Ziel in die Architektur eingebaut ist. Weniger Token pro Ergebnis statt mehr Token pro Umsatz.

Die Technologie dafür existiert. Was fehlt, ist das kommerzielle Interesse der großen Anbieter, denn ihr Geschäftsmodell basiert auf Volumen, nicht auf Effizienz. Die Autoindustrie hat jahrzehntelang effizientere Motoren und Modelle gebremst. Wir kennen das Ende dieser Geschichte und zahlen den Preis.

Widerstand im Stack

Doch der Widerstand muss nicht laut sein. Er kann technologisch sein. Wer lokale Modelle betreibt, auf eigener Hardware, mit Open-Weight-Modellen wie Llama, Qwen oder Mistral oder in gemeinschaftlichen Rechenzentren, die auf Tokeneffizienz ausgelegt sind, entzieht sich dem Token-Economy-Modell strukturell. Tokens werden produziert, ja. Aber sie werden nicht verkauft. Der Verbrauch kostet Strom und damit wird die einzige gesellschaftlich sinnvolle Metrik wieder relevant: Ergebnis pro Watt. Ergebnis pro Token.

Das ist sicher nicht die Lösung für jeden Anwendungsfall. Aber es gibt einen Mittelweg, der gesellschaftlich wichtiger ist als jeder produzierte Chip: die technologische Mündigkeit. Das Wissen, dass „Token = Value" eine Verkäufer-Metrik ist. Das Verständnis, dass ein KI-System, das für eine einfache Anfrage einen agentic Workflow startet, nicht produktiver, sondern einfach nur verschwenderisch und teuer ist. Dass Effizienz nicht Volumensteigerung bedeutet, sondern Zielerreichung mit minimalem Aufwand.

Und für Unternehmen die entscheidende Konsequenz: Fragt nicht, wie viele Tokens eure Mitarbeiter verbrauchen. Fragt, was sie dabei erreichen. Messt das Ergebnis. Nicht die Kilometer.

Epilog

Die Technologie KI gehört, in ihrer Entstehung, in ihrer Grundlogik, in ihrem Potenzial, der Gesellschaft. Sie ist aus ihr erwachsen, wie alle Technologien vor ihr auch.

Die Frage, wer die Infrastruktur dieser Technologie kontrolliert und bepreist, ist eine politische Frage. Sie sollte auch als solche behandelt werden. Genauso, wie wir als Gesellschaft irgendwann begriffen haben, dass Strom, Wasser und Straßen keine privaten Gnadengaben sind, sondern gesellschaftliche Grundversorgung.

Der Satz „Daten sind das neue Öl" stammt vom britischen Mathematiker Clive Humby aus dem Jahr 2006, gemeint als nüchterne Beobachtung über Rohstoffe, die erst Veredelung brauchen, bevor sie Wert entfalten. Was er damals nicht ahnte: dass seine Analogie eines Tages auch die Schattenseite des Öls einholen würde. Öl hat die Welt vorangebracht. Und es hat die menschliche Gemeinschaft in eine Abhängigkeit gezogen, aus der wir uns bis heute nicht befreien konnten. Tokens sind das neue Benzin. Und wir kennen das Ende dieser Geschichte. [Wikipedia: Clive Humby]

Jensen Huang hat die Frage, wem die KI-Infrastruktur gehört, bereits beantwortet. Seine Antwort lautet: Nvidia.

Die wichtigere Frage ist: Wie lautet unsere Antwort?