Zum Hintergrund: Seit heute, dem 1. Juni 2026, hat GitHub das Abrechnungsmodell für Copilot grundlegend umgestellt. Weg vom alten Premium-Request-Modell (PRU), der beliebten „Flatrate", hin zu einem tokenbasierten Abrechnungssystem namens GitHub AI Credits. 1 AI-Credit kostet 0,01 Dollar. Klingt harmlos, oder? Ist es aber nicht.
Das Experiment: Ein echter Dialog und eine ordentliche Rechnung
Ich habe heute Morgen, bewusst als erster kleiner Test meiner künftig zu erwartenden Kosten, Copilot zur Umstellung und Konfiguration meines Llama.cpp Servers genutzt und die Kosten dokumentiert. Ich bin seit ein paar Tagen dabei, von OLlama auf Llama.cpp umzusteigen. Dazu an anderer Stelle mehr. Da die Umstellung auf Llama.cpp einen gewissen Konfigurationsaufwand auf Script-Ebene bedeutet und ich als UX-Guy in diesem Bereich nicht besonders versiert bin, nutze ich hierfür seit einigen Monaten KI-Assistenz in Form eines CLIs. Keine Spielerei, sondern ein produktiver Konfigurationsdialog, wie er für viele Entwickler zum Alltag gehört. Das Copilot CLI mit Claude Sonnet als Brain hat hier immer ziemlich gute Arbeit geleistet. Bisher waren die Kosten gegenüber der Zeitersparnis auch leicht verschmerzbar. Bisher.
Eckdaten des Gesprächs:
- Dauer: ca. 45 Minuten
- Thema: Llama.cpp Router-Setup, Aliases, LaunchAgent, Vision-Modell-Integration
- Austausche: ca. 35–40 Turns, davon viele mit Code-Output, Datei-Edits und Shell-Befehlen
- Plattform: GitHub Copilot CLI / Chat
Das Ergebnis laut GitHub Billing-Dashboard: 2,42 Dollar Bruttoverbrauch. In einem einzigen Gespräch, in der ersten Stunde des neuen Monats. (Der Zähler stand heute Morgen bei 0,00 Dollar, das ließ sich deshalb besonders sauber überprüfen.)
Die rohen Daten – von GitHub selbst geliefert
GitHub stellt unter Settings → Billing → Usage einen CSV-Export bereit. Hier ist er, unverändert:
| Datum | Produkt | SKU | Menge | Einheit | Preis/Einheit | Brutto |
|---|---|---|---|---|---|---|
| 2026-06-01 | copilot | copilot_ai_credit | 99,60 | ai-credits | $0,01 | ~$1,00 |
Der CSV zeigt eine zusammengefasste Zeile. Das Dashboard zeigt 2,42 Dollar. Warum die Zahlen auseinandergehen, kann ich nicht abschließend erklären, die vollständige Darstellung liefert aber der Screenshot.
Was das im Vergleich zum alten Modell bedeutet
Nach dem Wechsel des Abrechnungsmodells durch GitHub werden alle Kosten, die vorher in der Flatrate verschwanden, sichtbar gemacht und direkt berechnet. Mein erster Dialog heute Morgen kostete bereits 2,42 Dollar. Der Zähler läuft ab sofort bei jedem Turn.
Der Grund liegt in der Natur des tokenbasierten Modells: Sobald du Copilot Chat öffnest, egal ob im CLI, in der VS Code Seitenleiste oder im Browser, schickt Copilot bei jedem Turn nicht nur deine aktuelle Frage, sondern den gesamten bisherigen Konversationskontext als Input mit. Und das bei einem Modell wie Claude Sonnet, das zu den teureren gehört. Bei langen, iterativen Dialogen wächst der Kontext mit jedem Turn und die Kosten steigen überproportional. Code Completions im Editor hingegen bleiben weiterhin ausgenommen und werden nicht extra berechnet. Teuer wird es beim Öffnen eines Chats und ganz besonders im Agent Mode.
Bei voller Nutzung des Copilots, so wie ich es mir bisher angewöhnt hatte, wird mein monatlicher Freibetrag wohl bereits am ersten Tag des Monats aufgebraucht sein. Da frag ich mich doch, ob ich dann nicht auch direkt zu einem anderen Provider wechseln kann.
Wann wird das Kontingent aufgebraucht?
Copilot Pro (10 Dollar/Monat) enthält ab sofort 1.000 AI-Credits. Klingt viel. Ist es aber nicht:
- Light User (gelegentliche Kurzfragen, ~30 Credits/Tag): Budget hält den ganzen Monat, es reicht theoretisch sogar für gut 33 Tage. Allerdings frage ich mich bei dieser Nutzungsintensität, wofür man ein Copilot-Abo bräuchte. Zum Committen?
- Medium User (täglich 1–2 längere Sessions wie heute, ~100 Credits/Tag): Budget erschöpft nach 10 Tagen und danach kostet die Nutzung 0,01 Dollar pro Credit on top. Bei weiteren 100 Credits täglich für die restlichen 20 Tage des Monats macht das nochmal $20 extra (~18 Euro). Und ganz ehrlich, mein Chat dauerte heut keine Stunde kostete aber ca 2,50 Dollar.
- Heavy User (intensive Coding-Sessions, ab 250 Credits/Tag): Budget weg nach Tag 4. Danach läuft der Zähler für die restlichen 26 Tage weiter und macht bei gleichem Tempo mindestenz 65 Dollar extra (~60 Euro) on top. Aus einem 10 Dollar-Abo wird dann schnell ein 75+ Dollar-Monat.
Und will man bei diesem Credit-Verbrauch bleiben, sollte man aus meiner Erfahrung auf keinen Fall den Agent Mode, Code Review oder das neue Claude Opus 4 verwenden. Sonst verbrennen die Credits noch schneller, denn jede agentische Session produziert weitere interne Model-Calls. Das Feature ist in allen bezahlten Abo-Plänen zugänglich. Ob es auch für jeden Nutzer bezahlbar bleibt, ist eine andere Frage.
Liebe Community: Das wird teuer
Das ist ein reales Problem. So wie ich nutzen sehr viele Entwickler Copilot täglich und intensiv und haben die Migration hoffentlich auf dem Radar. Wer monatlich abrechnet, wurde heute automatisch migriert. Wer noch einen aktiven Jahresplan hat, bleibt bis zu dessen Ablauf im alten Modell. Ihr Glücklichen.
By the way: Neue Pläne konnten ab dem 16. April 2026 nicht mehr abgeschlossen werden. GitHub hat die Anmeldungen für Pro, Pro+ und Student an diesem Tag ohne Vorwarnung eingefroren. Wer da noch keinen aktiven Plan hatte, war draußen.
590 Kommentare, 1.243 Thumbs-down auf die offizielle Ankündigung sprechen eine deutliche Sprache: Announcement & FAQ: Changes to GitHub Copilot Individual Plans · Discussion #192963
Die Konsequenzen für meinen Alltag
Aus dieser Entwicklung leitet sich für mich folgender Sofortplan ab:
- Wann nutze ich Copilot noch, und mit welchem Modell? Claude Sonnet ist teuer aber gut, GPT-5 mini ist günstig aber mäßig
- Der Agent Mode ist für mich wohl keine Option mehr – vielfacher Credit-Verbrauch durch Tool-Calls
- Budgetlimit setzen? GitHub erlaubt das unter Settings → Billing → Budgets, bei meinem bisherigen Nutzungsverhalten wäre ich aber wohl schnell am Limit
Schließlich will ich nicht in die Kostenfalle tappen, das Geld kann ich besser einsetzen. Ein namentlich nicht genanntes Unternehmen soll seinen Mitarbeitern uneingeschränkten Zugang zu Claude gegeben haben, ohne Spending Caps, ohne Usage Limits, ohne Dashboards. Das Ergebnis: eine 500-Millionen-Dollar-Rechnung in einem einzigen Monat. Mitarbeiter haben wohl den Agent Mode intensiv genutzt, lange Kontexte befeuert, teils für triviale Aufgaben wie Wettervorhersagen. Und niemand hat auf den Zähler geschaut: Claude API Burns $500M for Enterprise With No Caps
Mein Fazit: Lokal denken, Cloud dosieren
Ich beschäftige mich seit Monaten mit der Idee, einen lokalen KI-Stack zu betreiben und für meine Arbeit einzusetzen. Wenn doch bloß Qualität und Geschwindigkeit ähnlich wären wie das kommerzielle Angebot der Frontier-Anbieter. Aber bei der Kostenentwicklung der letzten Wochen, Einschränkung der Abo-Leistungen, Preiserhöhungen bei Modell-Updates und jetzt das neue Abrechnungsmodell von GitHub Copilot, muss ich meine Bequemlichkeit überdenken. Die Idee vom lokalen KI-Stack braucht eine Neubetrachtung, und vor allem eine ehrliche Neuberechnung.
Als jemand, der ohnehin einen unabhängigen KI Stack betreiben möchte, denn genau das dokumentiert dieser Blog, ist dieser Moment lehrreich und motivierend zugleich: Derselbe Chat, der mich heute 2,42 Dollar gekostet hat, hätte mit dem richtigen Hardware-Setup und einem Open-Weight-Modell keine Token-Kosten produziert.
Wahrscheinlich wäre das Ergebnis einer 14B-KI auf meinem M4-Mac (24 GB Unified Memory) und Llama-Router nicht ganz so befriedigend. Aber vielleicht sind es genau solche Entwicklungen, die die Motivation liefern, über ein KI-Hardware-Upgrade nachzudenken. Ein Upgrade, bei dem ich mit etwas mehr Geduld auf die Antwort unbegrenzte Token-Mengen produzieren kann, ohne laufenden Zähler. Und das bei vollständig privatem Prompting und 100% Datenschutz.
GitHub Copilot bleibt ein mächtiges Tool und für mich vielleicht auch die Rettung in der Not. Aber die Ära des „einfach drauflos chatten" ist vorbei. Ab heute muss jeder Token bewusst eingesetzt werden.