Zwanzig KI-Agenten, ein Flaschenhals: Ihr Kopf

Michael Dobler
Autor Dr. Web
3 Min. Lesezeit
Zwanzig KI-Agenten, ein Flaschenhals: Ihr Kopf

Addy Osmani, Entwickler bei Google, hat dem Dauerstress paralleler Coding-Agenten einen Namen gegeben: Orchestration Tax. Seine Analyse trifft jedes Team, das gerade ganze Flotten autonomer Agenten auf seine Codebasis loslässt.

drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügen

Parallele KI-Agenten lassen sich heute per Tastendruck starten, doch das Zusammenführen ihrer Ergebnisse bleibt Handarbeit. Genau diese Lücke beschreibt Osmani in einem Blogbeitrag als Orchestrierungssteuer, die jeder zahlt, der die Grenzen der eigenen Konzentration übersieht.

Das Wichtigste in Kürze

  • Osmani vergleicht den Menschen mit Pythons Global Interpreter Lock: beliebig viele Agenten, aber nur eine Instanz, die urteilt und zusammenführt.
  • Das Gesetz von Amdahl deckelt den Gewinn, weil der serielle Anteil der Arbeit, also Ihr Urteil, den gesamten Durchsatz begrenzt.
  • Zusätzliche Agenten füllen nur die Warteschlange vor dem Engpass und verschieben ihn nicht.
  • Als Gegenmittel koppelt Osmani die Agentenzahl an die eigene Prüfgeschwindigkeit statt an die Bedienoberfläche.

Warum macht mehr Parallelität nicht schneller?

Blaue Kügelchen fallen in und aus einem Glastrichter mit der Aufschrift „Bitte einzeln“
Agenten-Koordination erfordert mehr menschliche Aufmerksamkeit als ihre Initialisierung. Überprüfung und Integration mehrerer Agenten werden zum Engpass

Osmani beschreibt eine Asymmetrie, die viele Teams unterschätzen. Einen Agenten zu starten kostet einen Satz. Das Prüfen seiner Arbeit und der saubere Merge mit den anderen Agenten kosten dagegen Konzentration, und davon gibt es pro Mensch nur eine Portion.

Mensch als Engpass: Zur Erklärung greift Osmani zu einer Analogie aus der Programmierung. Pythons Global Interpreter Lock erlaubt viele Threads, doch nur einer darf zur selben Zeit rechnen. Dieses eine Lock halten Sie für Ihre Agenten. Sobald deren Arbeit echtes Architekturverständnis oder einen Merge-Konflikt verlangt, muss sie warten, bis Sie an der Reihe sind.

Amdahls Deckel: Das Gesetz von Amdahl macht die Grenze präzise. Der Gewinn durch Parallelisierung hängt am seriellen Anteil der Arbeit, und bei Coding-Agenten steckt dieser Anteil im Urteilsvermögen. Acht parallele Agenten lassen Ihr Urteilstempo unverändert und vertiefen nur die Warteschlange davor. Teams, die diesen Engpass ignorieren, optimieren genau den Teil, der nie das Problem war.

Die Versuchung, zwanzig Agenten gleichzeitig laufen zu lassen, ist groß. Produktiv wird ein Team aber erst, wenn es so viele Agenten startet, wie es deren Code am Ende auch prüfen kann.

— Markus Seyfferth, Chefredakteur Dr. Web

Wie steuern Teams ihre Aufmerksamkeit?

Glas-Sanduhr gefüllt mit kleinen Robotern vor weißem Hintergrund. Die Roboter fallen herab
Osmani empfiehlt, Aufmerksamkeit als nebenläufiges System zu behandeln. Die Agentenzahl richtet sich nach der Code-Prüfgeschwindigkeit, nicht nach UI-Kapazität. Für die meisten Entwickler liegt sie im niedrigen einstelligen Bereich

Osmani rät, die eigene Aufmerksamkeit wie ein nebenläufiges System zu behandeln. Die Zahl der Agenten richtet sich demnach nach der Geschwindigkeit, mit der Sie deren Code sauber prüfen können, nicht nach dem, was die Oberfläche zulässt. Für die meisten Entwickler liegt diese Zahl im niedrigen einstelligen Bereich.

Aufgaben trennen: Isolierte Routine lässt sich an Hintergrund-Agenten delegieren, die asynchron laufen und erst am Schluss eine Freigabe brauchen. Ein kniffliger Bug oder ein Architekturentwurf gehört dagegen nicht in die Parallelschleife, weil dort das Urteil selbst die eigentliche Arbeit ist. Gebündelte Reviews sparen zudem die teuren Kontextwechsel, die laut Osmani jeden kalten Wiedereinstieg verteuern. Wie schnell dieser Anspruch real wird, zeigt die Konferenz Code w/ Claude 2026, auf der Anthropic Multi-Agent-Orchestrierung präsentierte, während Mercado Libre und Shopify 90 % autonomes Coding anpeilen.

Für Teams, die gerade auf autonome Coding-Agenten umstellen, zählt darum vor allem eine ehrliche Messung der eigenen Prüfkapazität. Beginnen Sie mit zwei oder drei Agenten und skalieren Sie erst hoch, wenn Sie wissen, wie viele Pull Requests Sie pro Tag gründlich lesen. Sonst wächst der unbemerkte Stapel ungeprüften Codes, und mit ihm das Risiko beim nächsten Produktivausfall, wie ihn ein KI-Agent beim Löschen einer Produktivdatenbank bereits ausgelöst hat. Für den tieferen Einstieg in die Grundlagen liefert der LLMs-Ratgeber die nötige Einordnung.

Mehr #KI News

Mehr Newshunger?

Modell eines Gehirns mit grün leuchtendem Punkt und angeschlossenem Kabel
KI-Agent löschte versehentlich Produktivdatenbank; Claude 2026 bietet neue Features für Entwicklerteams trotz Token-Knappheit
4,5 10 Bewertungen

Wie hat Ihnen dieser Artikel gefallen?

Michael Dobler
Autor
Ich bin der Herausgeber von Dr. Web. Um praxisfit zu bleiben, unterstütze ich darüber hinaus Kunden bei der digitalen Kundengewinnung und Kundenbindung. Erste eigene Gehversuche im Internet unternahm ich 1999 mit einem Kinomagazin. Nach 15 Jahren in Lohn und Brot, u.a. als Projektmanager für digitale Medien, machte ich mich schließlich Ende 2005 selbständig. Das war die beste berufliche Entscheidung meines Lebens.
882 Artikel veröffentlicht
Alle Artikel

Schreiben Sie einen Kommentar

Ihre E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Newsletter

Mehr solcher Artikel?
Jetzt kostenlos abonnieren.

Jeden Dienstag die besten Artikel aus dem Dr. Web-Magazin direkt in Ihr Postfach – kein Spam, jederzeit abmeldbar.

Einmal pro Woche, kein täglicher Spam
Jederzeit mit einem Klick abmeldbar
DSGVO-konform via Brevo