ServiceNow und Uber haben ihre Jahresbudgets für KI-Tokens vor der Jahresmitte aufgebraucht. Anthropic verschärft Nutzungslimits. Für deutsche Unternehmen, die gerade KI-Agenten ausrollen, wird die Stromrechnung zur strategischen Frage.
drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügenDie Token-Krise trifft den Enterprise-Markt mit voller Wucht. Autonome KI-Agenten verbrauchen ein Vielfaches dessen, was klassische Chatbots brauchen. Wer einmal einen Multi-Step-Workflow startet, frisst pro Aufgabe schnell zehntausende Tokens. Die Rechnung kommt am Monatsende.
Das Wichtigste in Kürze
- ServiceNow und Uber haben ihre KI-Token-Jahresbudgets vor Jahresmitte aufgebraucht
- Anthropic verschärft Limits für Drittanbieter-Agentennutzung auf bezahlten Plänen
- OpenAI nutzt die Steilvorlage und bietet zwei Monate Codex kostenlos für Business-Kunden
- Deutsche Mittelständler unterschätzen die laufenden Kosten autonomer KI-Workflows
Warum Agenten so teuer sind

Ein klassischer Chatbot beantwortet eine Frage und schweigt. Ein autonomer Agent denkt, plant, ruft Tools auf, prüft Ergebnisse und korrigiert sich. Jeder dieser Schritte produziert Tokens auf der Input- und der Output-Seite. Bei komplexen Aufgaben wie der Erstellung eines Verträgsentwurfs oder der Analyse einer Bilanz summieren sich schnell hunderttausende Tokens pro Vorgang.
Die Kostenstruktur hat sich damit verschoben. Wer früher nach Lizenzen kalkulierte, rechnet jetzt nach Verbrauch. Eine einzelne Compliance-Prüfung mit Claude Opus 4.7 kann zwischen zwei und zwanzig Euro kosten, je nach Tiefe. Bei zehntausend Vorgängen pro Monat wird daraus eine sechsstellige Position im IT-Budget.
Wie Anthropic reagiert

Anbieter reagieren mit Drosselung. Anthropic hat im Mai separate Credit-Limits für Drittanbieter-Agenten eingeführt. Wer Claude über externe Tools wie Aider, Cursor oder Continue.dev nutzt, bekommt ein eigenes Kontingent, das vom Standard-Plan getrennt läuft. Die Reaktion auf X war heftig, Anthropic-Nutzer fühlen sich umgangen. OpenAI nutzte die Steilvorlage und bietet neuen Business-Kunden zwei Monate Codex kostenlos.
Für deutsche IT-Verantwortliche bedeutet das: Pricing-Modelle ändern sich schneller als Jahresverträge. Wer im Januar 2026 einen Enterprise-Vertrag mit fester Token-Allokation abgeschlossen hat, kann im November vor leeren Konten stehen. Die Kalkulation muss laufend justiert werden.
Autonome Agenten sind die teuerste Software, die ein Unternehmen jemals laufen lässt. Wer KI-Agenten ausrollt, ohne ein Monitoring auf Token-Verbrauch pro Use-Case zu installieren, baut eine offene Stromrechnung mit unbekanntem Ende.
— Markus Seyfferth, Chefredakteur Dr. Web
Was Mittelständler jetzt tun sollten

Drei Schutzmaßnahmen helfen sofort. Zunächst sollten Sie pro Anwendungsfall eine Verbrauchsobergrenze definieren und im API-Wrapper hart durchsetzen. Parallel lohnt der Vergleich kleinerer Modelle wie Claude Haiku oder GPT-4 Mini für Standardaufgaben, die kein Reasoning-Modell brauchen. Und schließlich gehört in jeden Agenten ein Logging-Layer, der Token-Verbrauch pro Aufgabe ausweist und Ausreißer markiert.
Mehr zur richtigen Modellwahl finden Sie im LLM-Ratgeber.
Mehr Newshunger?
