Für KI-Agenten: AWS baut seine Cloud um

Michael Dobler
Autor Dr. Web
3 Min. Lesezeit
Für KI-Agenten: AWS baut seine Cloud um

31 Prozent des gesamten HTTP-Traffics im Internet kommt heute von Bots. Rund ein Viertel davon entfällt auf KI-Crawler, KI-Assistenten und agentenbasierte Systeme. KI-Agenten verändern das Internet schneller als die Infrastruktur bisher mithalten kann. AWS zieht jetzt die Konsequenzen.

drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügen

Das Wichtigste in Kürze

  • AWS hat eine neue Generation von OpenSearch Serverless gestartet, die speziell für agentenbasierte Workloads ausgelegt ist.
  • Das System entkoppelt Compute von Storage: Rechenkapazität skaliert sekundengenau hoch und fällt bei Inaktivität auf null zurück.
  • Cloudflare prognostiziert, dass maschinengenerierter Traffic menschlichen Traffic in der ersten Jahreshälfte 2027 überholen wird.
  • Neben AWS ziehen auch Databricks, Snowflake, Microsoft Azure und Cloudflare mit eigener Agenteninfrastruktur nach.

Warum klassische Cloud-Infrastruktur bei KI-Agenten versagt

Hellblaue Parkuhr auf weißem Hintergrund mit Display, Schlitz und Tasten, mittig stehend
KI-Agenten erzeugen unvorhersehbare Spitzen und Pausen, die Cloud-Infrastrukturen überlasten, die für gleichmäßige menschliche Nutzung ausgelegt sind

Cloud-Infrastruktur wurde für menschliche Nutzungsmuster gebaut: gleichmäßiges Surfen, vorhersehbare Anfragen, stabiler Durchsatz. KI-Agenten verhalten sich anders. Tia White, General Managerin des Amazon OpenSearch Service, beschreibt das Problem präzise in einem TechCrunch-Gespräch: Agenten spiken ohne Vorwarnung, werden idle ohne Ankündigung. Infrastruktur, die auf menschliche Nutzungsrhythmen ausgelegt ist, reagiert auf diese Muster entweder zu langsam oder hält unnötig Ressourcen vor.

Das bisherige OpenSearch Serverless-Modell koppelte Compute und Storage fest aneinander. Selbst wenn kein Agent aktiv war, lief mindestens eine Instanz. Unternehmen zahlten für Rechenkapazität, die sie nicht nutzten. Idle-Kosten summierten sich gerade bei sporadischen, aber intensiven Agentenworkflows erheblich auf.

Was die neue Architektur konkret ändert

3D-Diorama: Kran hebt Gehirn auf leuchtenden Datenkubus, Schild mit KI-Bezug davor
AWS OpenSearch Serverless entkoppelt Compute von Storage und skaliert Rechenkapazität in Sekunden. Nutzer zahlen nur für tatsächlich genutzte Ressourcen

Mit der neuen OpenSearch Serverless-Generation entkoppelt AWS Compute vollständig vom Storage. Das System skaliert Rechenkapazität innerhalb von Sekunden hoch, sobald ein Agent Aufgaben auslöst, und fährt auf null zurück, sobald der Agent idle geht. White beschreibt es im Vergleich so: Bisher zahlte man dauerhaft für einen Parkplatz. Jetzt zahlt man nur noch für die Zeit, in der das Auto tatsächlich steht – ein Parkuhr-Modell statt Dauermiete.

Zum Start integriert sich OpenSearch Serverless nativ mit Entwicklerplattformen wie Vercel und Kiro. Entwickler können damit produktionsreife Such- und Vektor-Backends für Agenten ausrollen, ohne eigene Infrastruktur zu betreiben.

KI-Agenten gehen in Produktion, und ihre Traffic-Muster folgen keiner menschlichen Logik mehr. Cloud-Infrastruktur muss auf das reagieren können, was Agenten tun, nicht auf das, was Menschen tun.

— Markus Seyfferth, Chefredakteur Dr. Web

Ein Branchentrend, kein AWS-Einzelfall

Ein orangefarbener Container mit dem Text
Cloudanbieter rüsten ihre Infrastruktur für KI-Agenten auf: AWS, Databricks, Snowflake, Microsoft und Cloudflare integrieren Speicher- und Ausführungsfunktionen

AWS steht mit diesem Umbau nicht allein. Databricks und Snowflake positionieren sich als KI-Gedächtnis- und Retrieval-Systeme für Unternehmensdaten. Microsoft hat Azure-Updates ausgerollt, die Agenten-Traffic-Bursts abfangen und Speicher zwischen Agenten teilen. Cloudflare hat im April 2026 eigene Infrastruktur eingeführt, die Agenten persistente Ausführungsumgebungen und sofortige Skalierbarkeit bietet.

Lai Yi Ohlsen, Senior Product Manager bei Cloudflare, beziffert den Zeitpunkt: Maschinengenerierter Traffic wird menschlichen Traffic in der ersten Jahreshälfte 2027 übersteigen. Für IT-Verantwortliche bedeutet das, dass Infrastrukturplanung heute agentengerecht sein muss, nicht erst übermorgen. Wer Agentenworkloads auf Legacy-Infrastruktur betreibt, zahlt entweder zu viel für Idle-Compute oder bekommt bei echten Bursts Latenzprobleme, die den Nutzen agentischer Systeme untergraben.

Die Detailmeldung zum AWS-Launch hat TechCrunch veröffentlicht.

Mehr Newshunger?

Ein oranger Kunststoffbaustein in Noppenform mit dem Aufkleber „Mehr Newshunger?“
KI-Agenten im Kundenservice verursachen unerwartet hohe Token-Kosten und werden oft ohne Kundenbeteiligung geplant
4,4 16 Bewertungen

Wie hat Ihnen dieser Artikel gefallen?

Michael Dobler
Autor
Ich bin der Herausgeber von Dr. Web. Um praxisfit zu bleiben, unterstütze ich darüber hinaus Kunden bei der digitalen Kundengewinnung und Kundenbindung. Erste eigene Gehversuche im Internet unternahm ich 1999 mit einem Kinomagazin. Nach 15 Jahren in Lohn und Brot, u.a. als Projektmanager für digitale Medien, machte ich mich schließlich Ende 2005 selbständig. Das war die beste berufliche Entscheidung meines Lebens.
872 Artikel veröffentlicht
Alle Artikel

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Newsletter

Mehr solcher Artikel?
Jetzt kostenlos abonnieren.

Jeden Dienstag die besten Artikel aus dem Dr. Web-Magazin direkt in Ihr Postfach – kein Spam, jederzeit abmeldbar.

Einmal pro Woche, kein täglicher Spam
Jederzeit mit einem Klick abmeldbar
DSGVO-konform via Brevo