Ein KI-Agent übernimmt das Testen von Web- und Mobil-Apps und braucht dafür kein einziges Testskript. Das Startup TesterArmy, finanziert vom US-Inkubator Y Combinator, beschreibt die zu prüfenden Abläufe in normaler Sprache und lässt einen Agenten die Anwendung wie ein Mensch bedienen. Für Entwicklungsteams im Mittelstand rückt damit die Frage in den Vordergrund, wer künftig die Testpflege übernimmt.
drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügenAgentengestütztes Testen verspricht, einen mühsamen Teil der Qualitätssicherung zu automatisieren. Statt Selektoren zu pflegen und brüchige Skripte zu debuggen, formulieren Teams den Testfall als Satz, und der Agent klickt, tippt und prüft selbst.
Das Wichtigste in Kürze
- TesterArmy lässt einen KI-Agenten Web- und Mobil-Apps testen, beschrieben in natürlicher Sprache.
- Ein SDK, Testskripte oder eigene Infrastruktur sind nach Angaben des Anbieters nicht nötig.
- Der Agent bewältigt Login-Abläufe mit OAuth und Einmalpasswörtern und liefert Screenshots samt Bug-Report.
- Die Anbindung läuft über GitHub Actions, GitLab CI oder einen Webhook aus jeder Pipeline.
Wie unterscheidet sich der Ansatz von Playwright?

Playwright und Cypress sind Frameworks, bei denen das Team die Tests schreibt, die Flakiness debuggt und die Selektoren verwaltet. TesterArmy setzt eine Ebene darüber an: Der Anbieter führt die Tests als Dienst aus, pflegt sie und liefert bei jedem Release einen Nachweis. Im eigenen Repository liegt dabei kein Testcode.
Technisch startet der Dienst einen echten Browser und bewertet das Ergebnis mit einem KI-Agenten, der die Seite wie eine reale Person ansieht. Layout-Verschiebungen und Rendering-Fehler erkennt der Agent dabei visuell, nicht nur über den Quelltext. Ein persistenter Speicher hält Kontext über mehrere Läufe hinweg fest.
Wie sicher sind Anmeldedaten und Tests?

Der Agent meldet sich mit hinterlegten Zugangsdaten an, verarbeitet OAuth-Flows und empfängt Einmalpasswörter über eigene Postfächer pro Agent. Die Zugangsdaten liegen verschlüsselt mit AES-256-GCM im Ruhezustand. TesterArmy weist zudem eine SOC-2-Type-2-Zertifizierung und DSGVO-Konformität aus, was für DACH-Teams ein relevantes Auswahlkriterium ist.
Der Lauf lässt sich auf verschiedene Weise auslösen. Eine GitHub-App prüft Pull Requests automatisch, geplante Wiederholungen übernehmen das Produktions-Monitoring, und ein Webhook bindet beliebige CI-Pipelines an. Den Bericht mit Screenshots und Aufzeichnungen erhält das Team im Dashboard, über die CLI oder direkt im Pull Request.
Die Testpflege war jahrelang der undankbarste Teil der Entwicklung. Wenn ein Agent die Klickstrecken übernimmt, verschiebt sich die Arbeit vom Skripten zum Beschreiben, und genau das spart Teams echte Zeit.
— Michael Dobler, Herausgeber Dr. Web
Was bedeutet das für DACH-Entwicklerteams?

Für kleine Teams ohne eigene QA-Abteilung senkt der Ansatz die Hürde, kritische Nutzerpfade überhaupt automatisiert zu überwachen. Wer heute keine End-to-End-Tests pflegt, weil der Aufwand zu hoch erscheint, bekommt mit der Beschreibung in Klartext einen niederschwelligen Einstieg.
Prüfen Sie vor dem Einsatz, welche Ihrer kritischen Abläufe wie Anmeldung, Bezahlung oder Formularstrecken den größten Schaden anrichten, wenn sie unbemerkt brechen, und starten Sie genau dort. Welches Modell hinter solchen Agenten steckt, ordnet unser LLMs-Ratgeber ein.