„Die größte Veränderung meines Coding-Workflows in zwei Jahrzehnten Programmieren“: So beschreibt Andrej Karpathy seine Wende zum Agenten-getriebenen Coding. Stellen Sie sich vor, jemand programmiert seit zwanzig Jahren mit eigenen Händen, und ändert das innerhalb weniger Wochen radikal.
drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügenDas Wichtigste in Kürze
- Andrej Karpathy hat innerhalb weniger Wochen von 80 % manuellem Coding auf 80 % Agenten-Coding umgestellt
- Karpathy war Mitgründer von OpenAI und früherer Tesla-AI-Direktor
- Er listet vier konkrete Schwächen heutiger KI-Agenten als Risiken auf
- Eine 70-zeilige CLAUDE.md-Datei dazu erreichte über 110.000 Sterne auf GitHub
Was hat Karpathy genau geändert?

Die Kehrtwende kam in wenigen Wochen. Im November 2025 schrieb Karpathy noch 80 Prozent seines Codes manuell mit Autovervollständigung und nutzte nur zu 20 Prozent KI-Agenten. Im Januar 2026 hatte sich das Verhältnis umgekehrt: 80 Prozent Agent, 20 Prozent manuelle Edits und Feinarbeiten. „Ich programmiere jetzt wirklich hauptsächlich in Englisch, sage dem LLM etwas verschämt, welchen Code es schreiben soll“, schrieb Karpathy auf X.
Das Bemerkenswerte ist nicht die Zahl, sondern die Person. Karpathy galt im Oktober 2025 noch als prominenter Skeptiker und sagte über KI-Agenten: „Sie funktionieren einfach nicht.“ Drei Monate später ist er einer der lautesten Befürworter. Seine Begründung: Die Fähigkeit, Software in großen Code-Aktionen zu bearbeiten, sei schlicht zu nützlich, um sie weiter zu verschmähen.
Welche Schwächen hat er trotzdem identifiziert?

Trotz der Wende ist Karpathy nicht naiv. Er listet vier konkrete Versagensmuster heutiger KI-Coding-Agenten auf:
Stille Annahmen
Die Modelle treffen falsche Annahmen und arbeiten damit weiter, ohne nachzufragen. Sie managen ihre eigene Verwirrung nicht und suchen keine Klärung, wo ein menschlicher Junior-Entwickler längst gefragt hätte.
Hypertrophie der Abstraktionen
Die Modelle blähen Abstraktionen auf, statt einfache Probleme einfach zu lösen. Was sich auf hundert Zeilen reduzieren ließe, wird zu tausend Zeilen. Toter Code wird nicht aufgeräumt, weil das Aufräumen nicht zur Aufgabe gehörte.
Kollaterale Änderungen
Die Agenten ändern Codeteile mit, die gar nicht angefragt waren. Wer einen kleinen Bugfix verlangt, bekommt manchmal eine ganze Refactoring-Welle frei Haus, die er gar nicht wollte.
Fehlende Erfolgskriterien
Modelle präsentieren keine Trade-offs, widersprechen nicht, wenn sie sollten, und sind „etwas zu sycophantisch“, wie Karpathy formuliert. Es fehlen überprüfbare Erfolgskriterien, weshalb der Output ungeprüft als fertig gilt.
Wie reagiert die Entwickler-Community?

Die Reaktion war beeindruckend. Eine 70-zeilige CLAUDE.md-Datei, die Forrest Chang aus Karpathys vier Beobachtungen destillierte, hat in etwas mehr als drei Monaten die Marke von 110.000 Sternen auf GitHub überschritten und stand achtundzwanzig Tage in Folge auf Platz 1 der wöchentlichen GitHub-Trends. Sie liegt aktuell auf Platz 94 der globalen Repository-Rangliste nach Sternen.
Karpathy spricht inzwischen von „Agent Engineering“ als nächstem Schritt nach dem Vibe Coding. Der Begriff Agent macht klar, dass nicht mehr direkt programmiert wird, sondern dass Agenten angewiesen und überwacht werden. Engineering signalisiert, dass es sich um eine erlernbare Disziplin handelt, nicht um Bastelei.
Karpathys Liste der Schwächen ist die wichtigere Information als die 80-Prozent-Zahl. Wer KI-Coding-Agenten produktiv einsetzt, ohne diese vier Versagensmuster systematisch zu adressieren, baut sich technische Schulden auf, die ihn später teuer zu stehen kommen.
— Michael Dobler, Herausgeber Dr. Web
Was bedeutet das für Mittelstand und Entwickler-Teams?

Die Konsequenzen sind unterschiedlich, je nach Reifegrad. Erfahrene Senior-Entwickler übernehmen die Manager-Rolle, prüfen Output und definieren Erfolgskriterien. Junior-Entwickler stehen vor der Frage, wie sie eigene Kompetenz aufbauen sollen, wenn die Agenten ihnen die Schreibarbeit abnehmen, ohne dass sie das Schreiben gelernt hätten.
Für Entwicklungsleiter heißt das, Code-Reviews zu schärfen und CLAUDE.md-Dateien als verbindliche Leitplanken einzuführen. Wer Claude Mythos und ähnliche Modelle in produktiven Umgebungen einsetzt, sollte die vier Versagensmuster in interne Coding-Richtlinien übernehmen, bevor sich technische Schulden aufbauen.
Was sollten Entwicklungs-Teams jetzt prüfen?

Vier Punkte stehen oben auf der Liste. CLAUDE.md oder vergleichbare Skill-Dateien einführen, um typische Fehler des Agenten zu adressieren. Code-Review-Prozess auf agentengenerierten Code anpassen, denn Syntax-Fehler weichen subtilen konzeptuellen Fehlern. Junior-Entwickler-Ausbildung neu denken, weil das Schreiben-Lernen anders aussieht, wenn der Agent zuerst tippt. Und schließlich Erfolgskriterien definieren, die Agenten verifizieren können, sonst gilt jeder Output als fertig.
Mehr Newshunger?

- Was bringt Code w/ Claude 2026 für Entwicklerteams? Viel
- Findet Claude Mythos jede Sicherheitslücke? Fast
- Anthropic Claude Memory: Was die neue Funktion bringt
- 12 neue KI-Modelle in einer Woche? Willkommen in 2026
Quellen
Andrej Karpathy auf X – Random notes from claude coding quite a bit – https://x.com/karpathy/ – besucht am 08.05.2026
GitHub – forrestchang/andrej-karpathy-skills CLAUDE.md – https://github.com/forrestchang/andrej-karpathy-skills – besucht am 08.05.2026