Irgendwie habe ich immer geahnt, dass dieser Moment kommen würde. Ich hatte nur gehofft, er kommt später.
Wie es begann
Ich erinnere mich noch gut daran, wie ich das erste Mal ernsthaft mit Agentic Coding angefangen habe. Das war mit Blackbox, einem Tool, das mir gezeigt hat, was möglich wird, wenn man KI nicht nur als Autocomplete benutzt, sondern als echten Entwicklungspartner. Ich begann, Code zu verbessern, Aufgaben zu delegieren, Kontext zu übergeben, Ergebnisse zu hinterfragen und mit Assistenz zu verfeinern. Es hat funktioniert. Ziemlich gut sogar. Dann bin ich auf GitHub Copilot umgestiegen. Und war überzeugt. Ich habe mein erstes Budget hinterlegt und vorsichtig die Kosten kontrolliert, wie man es eben macht bei neuen Technologien.
Dabei ist wichtig zu verstehen: Ich bin UX-Designer. Entwickeln war nie meine Kernaufgabe. Schon JavaScript-Entwicklung fällt mir schwer. Mein Bereich sind die „bunten Dinge" in der Software, das Aussehen, wie sich die Benutzung anfühlt, das Gefühl, das bleibt, wenn man fertig ist. Komplexe Backendentwicklung gehört nicht dazu, auch wenn ich viele Ideen diesbezüglich habe. Doch mit KI-Code-Assistenz vergrößerte sich mein Toolset ins gefühlt Unendliche. Plötzlich war auch ich in der Lage, Dinge zu entwickeln, die ich sonst nur mit einem Entwicklerteam hätte umsetzen können. Zu einem viel, viel höheren Preis.
Was in den letzten Monaten als Experiment entstand, war CrucibleMark. Ein modulares LLM-Benchmark-Framework, das ich Modul für Modul vom Konzept bis zur Fertigstellung aufgebaut habe. Datenarchitektur, Scoring-Logik, Export-Pipeline, politischer Kompass, ToolUse-Benchmark. Dinge, die ich in dieser Tiefe und Geschwindigkeit alleine nie hätte realisieren können.
Und das GitHub-Budget stieg, nicht trotz besserer Nutzung, sondern wegen ihr. Erst 50 Dollar, dann 60 Dollar und irgendwann 100 Dollar im Monat. Denn Copilot entwickelte sich in dieser Zeit rasant weiter. Vom einfachen Single-Thread-Entwicklungs-Chat hin zu einem vollwertigen Agentic Workflow mit mehreren Subagenten, Tool-Integration und autonomen Arbeitsschritten. Was ich dafür bekam, war eine Assistenz, die mit mir wuchs. Und ich war bereit, dafür zu zahlen, auch weil im Vergleich mit einem Entwicklerteam das Monatsabo immer noch deutlich gewann.
Ein Trend, den ich kommen sah
Doch ich war nicht ahnungslos. Der Markt hatte bereits Zeichen geschickt. Anthropic war der erste Anbieter, bei dem ich beobachtete, wie die Abrechnung komplizierter wurde. Der Agentic-Token-Verbrauch war plötzlich nicht mehr Bestandteil des Standard-Abos. Tool-Use, Agenten-Workflows, intensive API-Nutzung, alles Dinge, die beim normalen Chatten kaum ins Gewicht fallen, aber beim ernsthaften Entwickeln mit KI schnell zur dominanten Kostenposition werden. Claude war gut, aber auch der teuerste. Was vorher inkludiert schien, wurde plötzlich separat berechnet. Und das war spürbar.
Dann OpenAI. In meinen eigenen Benchmark-Daten war es messbar: die Kosten eines GPT-mini-4.5-Benchmarks lagen beim Dreifachen eines GPT-mini-4.1-Benchmarks. Dieselbe Aufgabe, ein deutlich teureres Ergebnis.
Man liest ja in den Medien ständig von den immensen Infrastrukturkosten auf der einen und den unglaublichen Investitionen auf der anderen Seite. Stichwort: Nvidia und Co., die diese Entwicklung mit Investitionen in der Größe des Jahresbudgets eines Industriestaates am Laufen halten. Ich frage mich schon länger: Wie soll sich das refinanzieren? Ob ein paar Chat-Abos das wirklich tragen können? Und mit einem Blick auf die Konkurrenz zwischen OpenAI und Anthropic wird klar, dass der Druck von allen Seiten wächst.
GitHub Copilot war lange meine Insel. Günstig, mächtig, nahtlos integriert. Hier konnte ich Claude-Sonnet-Assistenz zu einem wirklich guten Preis nutzen. Da drängt sich doch die Frage auf, wie Microsoft das halten konnte. Entweder zogen die anderen Anbieter uns Nutzer über den Tisch, oder Microsoft subventionierte sein Angebot. Jetzt weiß ich es: Sie haben subventioniert. Und ab Juni 2026 ist die schöne Zeit vorbei.
Die Mitteilung
Dann kam diese Nachricht von GitHub.
Ab dem 1. Juni 2026 stellt Copilot auf nutzungsbasiertes Billing um. PRUs werden durch AI Credits ersetzt.
Klingt zunächst technisch, beinahe harmlos. Dann habe ich mir das bereitgestellte Dashboard angeschaut, mit dem ich darstellen konnte, was mein April-Nutzungsverhalten unter dem neuen Modell gekostet hätte. Ein faires Vorgehen — und eine erschreckende Erkenntnis: Ein Anstieg von knapp 100 Dollar auf 850 Dollar. Inkludiert im Plan: 39 Dollar Monatsabokosten.
Das ist das Achtfache. Wer bisher 80 bis 100 Dollar im Monat ausgegeben hat und beim gleichen Nutzungsverhalten bleibt, zahlt künftig 800 bis 900 Dollar. Wer sein bisheriges Budget beibehält, bekommt im Gegenzug nur noch einen Bruchteil der bisherigen Leistung. Ich kann mir ehrlich gesagt nicht vorstellen, wie ich damit sinnvoll weiterarbeiten soll.
Ist das jetzt das Ende?
Nein. Aber es ist das Ende einer Ära. Keiner konnte vor zwei Jahren ahnen, wie sich diese Reise entwickeln würde. Die Kostenexplosion, die weltweite Nachfrage, die Geschwindigkeit, mit der sich eine ganze Industrie umgestellt hat. Diese Phase glich einem Ritt auf einem wilden Stier. Niemand hatte wirklich die Kontrolle. Die Dynamik hat die Geschäftsmodelle selbst mitgerissen.
Und wie bei jeder neuen Technologie, bei jedem neuen Start-up gilt auch hier: Erst kommt die Kundenbindung. Dann kommt die Rechnung. Die KI-Anbieter haben uns alle, mich eingeschlossen, mit digitalen Süßigkeiten von ihrem Angebot abhängig gemacht. Haben uns die Vorteile der neuen Arbeitsweise erleben lassen. Irgendwann ist die Gewöhnung da, und der Preis wird egal(er).
Ich möchte nicht mehr dahin zurück, wo ich noch vor einem Jahr war. Ein Workflow ohne KI-Assistenz bedeutet für mich heute: zähes Vorankommen, enormer Energieaufwand, deutlich langsamere Entwicklungsfortschritte. Und ich bin kein Einzelfall. Wie viele Unternehmen haben sich bereits so tief umgestellt, dass ein Zurück kaum noch vorstellbar ist? Denn abgerechnet wird zum Schluss. Und jetzt ist Schluss.
Die Rechnung dreht sich
Doch wo eine Tür zugeht, geht eine andere auf. Bei den zukünftig zu erwartenden Kosten rückt bei mir ein Thema wieder in den Vordergrund, über das ich schon länger nachdenke: eine eigene lokale Infrastruktur aufzubauen, die mir erlaubt, KI datenschutzkonform, unabhängig und ohne monatliche Überraschungen zu nutzen.
Bisher schien diese Überlegung immer zu früh. Bei 100 Dollar Monatskosten für GitHub Copilot rechnete ich: Selbst über drei Jahre fahre ich mit einem Cloud-Abo günstiger als mit einer lokalen Hochleistungsmaschine. Der einzige wirkliche Nachteil war der Datenschutz, die Tatsache, dass mein Code und meine Prompts in die USA abfließen. Unbefriedigend, aber tolerierbar.
Doch jetzt dreht sich der Wind. Konkret stehen bei mir zwei Optionen auf dem Tisch. Die erste: Ich ersetze mein MacBook Pro durch ein 128-GB-Unified-Memory-Monster. Das ist kein normales MacBook Pro mehr — das ist eine Höllenmaschine im Laptop-Format. Mit 128 GB RAM lassen sich ernstzunehmende lokale Modelle vollständig im Speicher halten, ohne Kompromisse. Der Preis liegt mit rund 6.000 Euro im Extrembereich. Lokal, leise und überall dabei.
Die zweite Option interessiert mich schon länger: der ASUS Ascent GX10, ein kompakter Supercomputer für die lokale Infrastruktur, mit Nvidia-Chip und 128 GB Unified Memory für die lokale Nutzung konzipiert. Der Preis: ca 4000 Euro. Klein, unauffällig, leistungsstark. Ein Gerät, das ich noch nicht besitze, über das ich aber seit seiner Ankündigung nachdenke. Stationär, im Heimnetz betrieben, als dedizierte lokale KI-Station. Weniger mobil als ein MacBook, aber für alles, was ich tagsüber am Schreibtisch entwickle, mehr als ausreichend. Und bei den aktuell explodierenden Cloud-Preisen rechnet sich eine solche Investition plötzlich innerhalb eines Jahres. Vielleicht sogar schneller.
Beginnt jetzt die Zeit der Open-Weight-Modelle?
Was mich dabei nicht mehr ängstigt, ist die Qualitätsfrage. Noch vor zwei Jahren war „lokal" gleichbedeutend mit „schlechter". Das stimmt so nicht mehr. In den CrucibleMark-Daten ist es messbar: Modelle wie GPT-OSS, Qwen 3, Kimi-K2 und Mistral-Derivate erreichen in vielen Aufgabenbereichen ein Niveau, das mit kommerziellen Modellen mithalten kann. Was bisher ein Kompromiss war, ist es zunehmend nicht mehr.
Und so passiert etwas Interessantes. Die Preiserhöhungen der großen Anbieter liefern genau den wirtschaftlichen Druck, der lokale und Open-Weight-Alternativen in die breite Praxis treiben könnte. Nicht aus Idealismus oder aus Open-Source-Überzeugung. Sondern aus wirtschaftlichem Kalkül.
… denn abgerechnet wird zum Schluss
Keiner konnte ahnen, wie sich diese Reise entwickeln würde. Mit kommerziellen Cloud-Modellen wurde eine neue, technologische Zeit etabliert. Diese Technologie hat gezeigt, was zukünftig möglich ist, hat Entwickler an KI-Assistenz gewöhnt und gebunden und uns alle produktiver gemacht, als wir es uns je hätten vorstellen können. Und jetzt, wo niemand mehr ohne kann, kommt die Rechnung.
Doch es scheint, als wären genau in diesem Moment die Open-Weights-Modelle so gut geworden, dass die Frage nicht mehr lautet: Kann ich lokal arbeiten? Sondern: Warum nicht jetzt?
Ich denke, ich werde es herausfinden. Die nötigen Benchmarks dazu habe ich ja schon.