KI-Agent Testing: Apps prüfen ohne Testskript?

KI-Agent statt Testskript: TesterArmy prüft Apps in Klartext

Markus Seyfferth

Autor Dr. Web

22. Juni 2026

3 Min. Lesezeit

Ein KI-Agent übernimmt das Testen von Web- und Mobil-Apps und braucht dafür kein einziges Testskript. Das Startup TesterArmy, finanziert vom US-Inkubator Y Combinator, beschreibt die zu prüfenden Abläufe in normaler Sprache und lässt einen Agenten die Anwendung wie ein Mensch bedienen. Für Entwicklungsteams im Mittelstand rückt damit die Frage in den Vordergrund, wer künftig die Testpflege übernimmt.

drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügen

Agentengestütztes Testen verspricht, einen mühsamen Teil der Qualitätssicherung zu automatisieren. Statt Selektoren zu pflegen und brüchige Skripte zu debuggen, formulieren Teams den Testfall als Satz, und der Agent klickt, tippt und prüft selbst.

Das Wichtigste in Kürze

TesterArmy lässt einen KI-Agenten Web- und Mobil-Apps testen, beschrieben in natürlicher Sprache.
Ein SDK, Testskripte oder eigene Infrastruktur sind nach Angaben des Anbieters nicht nötig.
Der Agent bewältigt Login-Abläufe mit OAuth und Einmalpasswörtern und liefert Screenshots samt Bug-Report.
Die Anbindung läuft über GitHub Actions, GitLab CI oder einen Webhook aus jeder Pipeline.

Wie unterscheidet sich der Ansatz von Playwright?

Ein hellblauer Spielzeugroboter mit der Aufschrift QA und einer Checkliste — TesterArmy führt als Service Browsertests durch und pflegt sie, während Playwright und Cypress Tests vom Team selbst geschrieben und verwaltet werden müssen

Playwright und Cypress sind Frameworks, bei denen das Team die Tests schreibt, die Flakiness debuggt und die Selektoren verwaltet. TesterArmy setzt eine Ebene darüber an: Der Anbieter führt die Tests als Dienst aus, pflegt sie und liefert bei jedem Release einen Nachweis. Im eigenen Repository liegt dabei kein Testcode.

Technisch startet der Dienst einen echten Browser und bewertet das Ergebnis mit einem KI-Agenten, der die Seite wie eine reale Person ansieht. Layout-Verschiebungen und Rendering-Fehler erkennt der Agent dabei visuell, nicht nur über den Quelltext. Ein persistenter Speicher hält Kontext über mehrere Läufe hinweg fest.

Wie sicher sind Anmeldedaten und Tests?

Offener Safe enthält Holzblöcke mit Texten wie „PASSWORT“, „E-MAIL“ und einer Brille — Agent authentifiziert sich mit verschlüsselten Zugangsdaten, verarbeitet OAuth-Flows und empfängt Einmalpasswörter. TesterArmy bietet SOC-2-Type-2-Zertifizierung und DSGVO-Konformität

Der Agent meldet sich mit hinterlegten Zugangsdaten an, verarbeitet OAuth-Flows und empfängt Einmalpasswörter über eigene Postfächer pro Agent. Die Zugangsdaten liegen verschlüsselt mit AES-256-GCM im Ruhezustand. TesterArmy weist zudem eine SOC-2-Type-2-Zertifizierung und DSGVO-Konformität aus, was für DACH-Teams ein relevantes Auswahlkriterium ist.

Der Lauf lässt sich auf verschiedene Weise auslösen. Eine GitHub-App prüft Pull Requests automatisch, geplante Wiederholungen übernehmen das Produktions-Monitoring, und ein Webhook bindet beliebige CI-Pipelines an. Den Bericht mit Screenshots und Aufzeichnungen erhält das Team im Dashboard, über die CLI oder direkt im Pull Request.

Die Testpflege war jahrelang der undankbarste Teil der Entwicklung. Wenn ein Agent die Klickstrecken übernimmt, verschiebt sich die Arbeit vom Skripten zum Beschreiben, und genau das spart Teams echte Zeit.
— Michael Dobler, Herausgeber Dr. Web

Was bedeutet das für DACH-Entwicklerteams?

Ein Roboterarm hält eine Lupe über einem Buch mit Text und eine bunte Gummiente davor — Kleine Teams automatisieren kritische Nutzerpfade durch verständliche Beschreibungen ohne hohen Aufwand

Für kleine Teams ohne eigene QA-Abteilung senkt der Ansatz die Hürde, kritische Nutzerpfade überhaupt automatisiert zu überwachen. Wer heute keine End-to-End-Tests pflegt, weil der Aufwand zu hoch erscheint, bekommt mit der Beschreibung in Klartext einen niederschwelligen Einstieg.

Prüfen Sie vor dem Einsatz, welche Ihrer kritischen Abläufe wie Anmeldung, Bezahlung oder Formularstrecken den größten Schaden anrichten, wenn sie unbemerkt brechen, und starten Sie genau dort. Welches Modell hinter solchen Agenten steckt, ordnet unser LLMs-Ratgeber ein.