Parallele KI-Agenten: mehr Output oder nur mehr Stress?

Zwanzig KI-Agenten, ein Flaschenhals: Ihr Kopf

Michael Dobler

Autor Dr. Web

30. Mai 2026

Aktualisiert: 1. Juli 2026

2 Min. Lesezeit

Addy Osmani, Entwickler bei Google, hat dem Dauerstress paralleler Coding-Agenten einen Namen gegeben: Orchestration Tax. Seine Analyse trifft jedes Team, das gerade ganze Flotten autonomer Agenten auf seine Codebasis loslässt.

drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügen

Parallele KI-Agenten lassen sich heute per Tastendruck starten, doch das Zusammenführen ihrer Ergebnisse bleibt Handarbeit. Genau diese Lücke beschreibt Osmani in einem Blogbeitrag als Orchestrierungssteuer, die jeder zahlt, der die Grenzen der eigenen Konzentration übersieht.

Das Wichtigste in Kürze

Osmani vergleicht den Menschen mit Pythons Global Interpreter Lock: beliebig viele Agenten, aber nur eine Instanz, die urteilt und zusammenführt.
Das Gesetz von Amdahl deckelt den Gewinn, weil der serielle Anteil der Arbeit, also Ihr Urteil, den gesamten Durchsatz begrenzt.
Zusätzliche Agenten füllen nur die Warteschlange vor dem Engpass und verschieben ihn nicht.
Als Gegenmittel koppelt Osmani die Agentenzahl an die eigene Prüfgeschwindigkeit statt an die Bedienoberfläche.

Warum macht mehr Parallelität nicht schneller?

Blaue Kügelchen fallen in und aus einem Glastrichter mit der Aufschrift „Bitte einzeln“ — Agenten-Koordination erfordert mehr menschliche Aufmerksamkeit als ihre Initialisierung. Überprüfung und Integration mehrerer Agenten werden zum Engpass

Osmani beschreibt eine Asymmetrie, die viele Teams unterschätzen. Einen Agenten zu starten kostet einen Satz. Das Prüfen seiner Arbeit und der saubere Merge mit den anderen Agenten kosten dagegen Konzentration, und davon gibt es pro Mensch nur eine Portion.

Mensch als Engpass: Zur Erklärung greift Osmani zu einer Analogie aus der Programmierung. Pythons Global Interpreter Lock erlaubt viele Threads, doch nur einer darf zur selben Zeit rechnen. Dieses eine Lock halten Sie für Ihre Agenten. Sobald deren Arbeit echtes Architekturverständnis oder einen Merge-Konflikt verlangt, muss sie warten, bis Sie an der Reihe sind.

Amdahls Deckel: Das Gesetz von Amdahl macht die Grenze präzise. Der Gewinn durch Parallelisierung hängt am seriellen Anteil der Arbeit, und bei Coding-Agenten steckt dieser Anteil im Urteilsvermögen. Acht parallele Agenten lassen Ihr Urteilstempo unverändert und vertiefen nur die Warteschlange davor. Teams, die diesen Engpass ignorieren, optimieren genau den Teil, der nie das Problem war.

Die Versuchung, zwanzig Agenten gleichzeitig laufen zu lassen, ist groß. Produktiv wird ein Team aber erst, wenn es so viele Agenten startet, wie es deren Code am Ende auch prüfen kann.
— Markus Seyfferth, Chefredakteur Dr. Web

Wie steuern Teams ihre Aufmerksamkeit?

Glas-Sanduhr gefüllt mit kleinen Robotern vor weißem Hintergrund. Die Roboter fallen herab — Osmani empfiehlt, Aufmerksamkeit als nebenläufiges System zu behandeln. Die Agentenzahl richtet sich nach der Code-Prüfgeschwindigkeit, nicht nach UI-Kapazität. Für die meisten Entwickler liegt sie im niedrigen einstelligen Bereich

Osmani rät, die eigene Aufmerksamkeit wie ein nebenläufiges System zu behandeln. Die Zahl der Agenten richtet sich demnach nach der Geschwindigkeit, mit der Sie deren Code sauber prüfen können, nicht nach dem, was die Oberfläche zulässt. Für die meisten Entwickler liegt diese Zahl im niedrigen einstelligen Bereich.

Aufgaben trennen: Isolierte Routine lässt sich an Hintergrund-Agenten delegieren, die asynchron laufen und erst am Schluss eine Freigabe brauchen. Ein kniffliger Bug oder ein Architekturentwurf gehört dagegen nicht in die Parallelschleife, weil dort das Urteil selbst die eigentliche Arbeit ist. Gebündelte Reviews sparen zudem die teuren Kontextwechsel, die laut Osmani jeden kalten Wiedereinstieg verteuern. Wie schnell dieser Anspruch real wird, zeigt die Konferenz Code w/ Claude 2026, auf der Anthropic Multi-Agent-Orchestrierung präsentierte, während Mercado Libre und Shopify 90 % autonomes Coding anpeilen.

Für Teams, die gerade auf autonome Coding-Agenten umstellen, zählt darum vor allem eine ehrliche Messung der eigenen Prüfkapazität. Beginnen Sie mit zwei oder drei Agenten und skalieren Sie erst hoch, wenn Sie wissen, wie viele Pull Requests Sie pro Tag gründlich lesen. Sonst wächst der unbemerkte Stapel ungeprüften Codes, und mit ihm das Risiko beim nächsten Produktivausfall, wie ihn ein KI-Agent beim Löschen einer Produktivdatenbank bereits ausgelöst hat. Für den tieferen Einstieg in die Grundlagen liefert der LLMs-Ratgeber die nötige Einordnung.

Mehr #KI News