KI-Agenten sprengen das Budget: Die Token-Krise erreicht den Mittelstand

Michael Dobler
Autor Dr. Web
Aktualisiert:
3 Min. Lesezeit
KI-Agenten sprengen das Budget: Die Token-Krise erreicht den Mittelstand

ServiceNow und Uber haben ihre Jahresbudgets für KI-Tokens vor der Jahresmitte aufgebraucht. Anthropic verschärft Nutzungslimits. Für deutsche Unternehmen, die gerade KI-Agenten ausrollen, wird die Stromrechnung zur strategischen Frage.

drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügen

Die Token-Krise trifft den Enterprise-Markt mit voller Wucht. Autonome KI-Agenten verbrauchen ein Vielfaches dessen, was klassische Chatbots brauchen. Wer einmal einen Multi-Step-Workflow startet, frisst pro Aufgabe schnell zehntausende Tokens. Die Rechnung kommt am Monatsende.

Das Wichtigste in Kürze

  • ServiceNow und Uber haben ihre KI-Token-Jahresbudgets vor Jahresmitte aufgebraucht
  • Anthropic verschärft Limits für Drittanbieter-Agentennutzung auf bezahlten Plänen
  • OpenAI nutzt die Steilvorlage und bietet zwei Monate Codex kostenlos für Business-Kunden
  • Deutsche Mittelständler unterschätzen die laufenden Kosten autonomer KI-Workflows

Warum Agenten so teuer sind

Offenes braunes Portemonnaie mit Metallanhänger
Autonome Agenten verursachen durch iterative Prozesse wie Planung, Tool-Nutzung und Selbstkorrektur deutlich mehr Tokens als einfache Chatbots und damit erhebliche Kosten

Ein klassischer Chatbot beantwortet eine Frage und schweigt. Ein autonomer Agent denkt, plant, ruft Tools auf, prüft Ergebnisse und korrigiert sich. Jeder dieser Schritte produziert Tokens auf der Input- und der Output-Seite. Bei komplexen Aufgaben wie der Erstellung eines Verträgsentwurfs oder der Analyse einer Bilanz summieren sich schnell hunderttausende Tokens pro Vorgang.

Die Kostenstruktur hat sich damit verschoben. Wer früher nach Lizenzen kalkulierte, rechnet jetzt nach Verbrauch. Eine einzelne Compliance-Prüfung mit Claude Opus 4.7 kann zwischen zwei und zwanzig Euro kosten, je nach Tiefe. Bei zehntausend Vorgängen pro Monat wird daraus eine sechsstellige Position im IT-Budget.

Wie Anthropic reagiert

Dokumentenstapel mit orangefarbenem Gummiband, Metallklammer und Plakette, darauf Text
Anthropic führt separate Credit-Limits für Drittanbieter-Agenten ein, um externe Tools wie Aider und Cursor zu drosseln. Die Nutzer reagieren verärgert

Anbieter reagieren mit Drosselung. Anthropic hat im Mai separate Credit-Limits für Drittanbieter-Agenten eingeführt. Wer Claude über externe Tools wie Aider, Cursor oder Continue.dev nutzt, bekommt ein eigenes Kontingent, das vom Standard-Plan getrennt läuft. Die Reaktion auf X war heftig, Anthropic-Nutzer fühlen sich umgangen. OpenAI nutzte die Steilvorlage und bietet neuen Business-Kunden zwei Monate Codex kostenlos.

Für deutsche IT-Verantwortliche bedeutet das: Pricing-Modelle ändern sich schneller als Jahresverträge. Wer im Januar 2026 einen Enterprise-Vertrag mit fester Token-Allokation abgeschlossen hat, kann im November vor leeren Konten stehen. Die Kalkulation muss laufend justiert werden.

Autonome Agenten sind die teuerste Software, die ein Unternehmen jemals laufen lässt. Wer KI-Agenten ausrollt, ohne ein Monitoring auf Token-Verbrauch pro Use-Case zu installieren, baut eine offene Stromrechnung mit unbekanntem Ende.

— Markus Seyfferth, Chefredakteur Dr. Web

Was Mittelständler jetzt tun sollten

Ein zerbrochener oranger Roboter mit Dollarzeichen wird von einer großen Münze zerschlagen
Pro Anwendungsfall Verbrauchsobergrenze im API-Wrapper setzen, kleinere Modelle für Standardaufgaben nutzen, Logging-Layer für Token-Monitoring einbauen

Drei Schutzmaßnahmen helfen sofort. Zunächst sollten Sie pro Anwendungsfall eine Verbrauchsobergrenze definieren und im API-Wrapper hart durchsetzen. Parallel lohnt der Vergleich kleinerer Modelle wie Claude Haiku oder GPT-4 Mini für Standardaufgaben, die kein Reasoning-Modell brauchen. Und schließlich gehört in jeden Agenten ein Logging-Layer, der Token-Verbrauch pro Aufgabe ausweist und Ausreißer markiert.

Mehr zur richtigen Modellwahl finden Sie im LLM-Ratgeber.

Mehr Newshunger?

Schreibmaschine mit eingelegtem Papier und herausquellendem Bonrollenband auf weißem Grund
KI-Einsatz in deutschen Unternehmen verdoppelt sich. Enterprise-KI-Markt wächst, Infrastrukturanbieter wie Cisco und Cerebras profitieren. B2B-Käufer recherchieren vermehrt KI-Tools
4,5 8 Bewertungen

Wie hat Ihnen dieser Artikel gefallen?

Michael Dobler
Autor
Ich bin der Herausgeber von Dr. Web. Um praxisfit zu bleiben, unterstütze ich darüber hinaus Kunden bei der digitalen Kundengewinnung und Kundenbindung. Erste eigene Gehversuche im Internet unternahm ich 1999 mit einem Kinomagazin. Nach 15 Jahren in Lohn und Brot, u.a. als Projektmanager für digitale Medien, machte ich mich schließlich Ende 2005 selbständig. Das war die beste berufliche Entscheidung meines Lebens.
822 Artikel veröffentlicht
Alle Artikel

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Newsletter

Mehr solcher Artikel?
Jetzt kostenlos abonnieren.

Jeden Dienstag die besten Artikel aus dem Dr. Web-Magazin direkt in Ihr Postfach – kein Spam, jederzeit abmeldbar.

Einmal pro Woche, kein täglicher Spam
Jederzeit mit einem Klick abmeldbar
DSGVO-konform via Brevo