KI-Betrug in der Prüfung: Was lernen Arbeitgeber?

Massiver KI-Betrug bei einer Prüfung an der Brown University

Markus Seyfferth

Autor Dr. Web

29. Juni 2026

4 Min. Lesezeit

Die akademische Integrität gerät unter Druck, und der Fall an der Brown University führt vor, warum Unternehmen das Thema genauso angehen müssen wie Hochschulen. Waren Sie schon in der Situation, eine Bewerbung oder ein Zertifikat in der Hand zu halten und nicht zu wissen, ob die Leistung echt war?

drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügen

Ein Wirtschaftsprofessor an der Eliteuniversität in Rhode Island hat einen der größten bekannten Betrugsfälle der Ivy League aufgedeckt. Hinter der Schlagzeile steckt ein strukturelles Problem, das jede Personalabteilung im DACH-Raum betrifft.

Das Wichtigste in Kürze

Bei einer Take-home-Klausur an der Brown University sollen mindestens 50 Studierende KI eingesetzt haben, der Notendurchschnitt lag bei 96 von 100 Punkten.
KI-Detektoren liefern keine verlässlichen Beweise: dokumentierte Falsch-Positiv-Raten reichen von rund 1 % bis über 10 %, bei Nicht-Muttersprachlern teils über 60 %.
Den größten Schaden trägt die Aussagekraft von Prüfungen, Zertifikaten und Bewerbungsunterlagen.
Für Unternehmen bedeutet das: weg vom Text, hin zum überprüfbaren Kompetenznachweis.

Der Madrider Ökonom Roberto Serrano unterrichtet seit 34 Jahren in Providence einen anspruchsvollen Kurs zur mathematischen Wirtschaftstheorie. Bei der Klausur vom 5. März erzielten 40 von 86 Teilnehmenden die volle Punktzahl. Korrektoren stießen auf auffällige Passagen, die mit den Ausgaben von ChatGPT übereinstimmten. Die Reaktion der Hochschulspitze beschreibt Serrano als kühl, bis hin zu Schweigen.

Warum versagen KI-Detektoren so zuverlässig?

Benotetes Klausurblatt mit Diagramm und Pseudocode sowie ein oranger Druckbleistift — KI-Detektoren verwechseln formales Fachdeutsch mit KI-Text, da beide ähnliche statistische Muster bei Perplexität und Burstiness aufweisen

Der Mechanismus hinter dem Versagen folgt keinem Zufall, sondern liegt in der Funktionsweise. KI-Detektoren messen statistische Auffälligkeiten wie Perplexität und Burstiness, also wie überraschend und wie schwankend die Wortwahl ausfällt. Sauberes, formales Fachdeutsch erzeugt dieselben gleichförmigen Muster wie ein Sprachmodell. Deshalb markieren die Werkzeuge ehrliche Texte fälschlich als KI.

Die Zahlen verdeutlichen das Dilemma. Turnitin korrigierte die eigene Falsch-Positiv-Quote nach dem Praxiseinsatz von 1 % auf 4 %, GPTZero zeigte in Tests rund 10 % statt der beworbenen 1 bis 2 %. Eine im Januar 2026 erschienene Analyse rechnet bei den von OpenAI genannten Ausgangswerten mit einer Falsch-Positiv-Rate von etwa 9 %, also rund einer von zehn unschuldig Beschuldigten, bei gleichzeitig hoher Trefferquote für tatsächliche KI-Texte, die durchfällt.

Besonders heikel wirkt der eingebaute Bias. Das Hochschulforum Digitalisierung verweist auf eine Studie, in der die Falsch-Positiv-Rate bei Nicht-Muttersprachlern über 60 % lag. Für Unternehmen, die international rekrutieren, bleibt ein Werkzeug mit dieser Schieflage juristisch und ethisch kaum tragbar.

Ist das ein Einzelfall oder ein Muster?

Eine alte Waage mit Textkarten und einem Fragezeichen symbolisiert Entscheidungsprozesse — KI-Detektoren wiegen Wahrscheinlichkeiten ab, sie liefern keinen Beweis.

Der Fall Brown reiht sich in eine klare Entwicklung ein. An der Australian Catholic University führte der Einsatz von Detektoren zu Tausenden falscher Vorwürfe, woraufhin die Hochschule den Turnitin-Detektor abschaltete. Vanderbilt, Cornell, Pittsburgh und die University of Cape Town haben ihre Detektoren ebenfalls deaktiviert oder vom Einsatz abgeraten.

Parallel verliert die schriftliche Bewerbung ihren Aussagewert. Laut einer Umfrage des Dienstleisters Resume Builder geben rund 45 % der Befragten zu, ihre Kompetenzen im Bewerbungsprozess mit KI aufgebläht zu haben. Ein Gartner-Bericht hält für möglich, dass bis 2028 jede vierte Bewerbung gefälscht sein könnte. Sobald KI auf beiden Seiten schreibt und filtert, prüft das Dokument nur noch, wer am besten formulieren lässt. Wie Personaler heute schon KI-generierte Unterlagen erkennen, zeigt unsere Übersicht zu Bewerbungsvorlagen und ihren typischen KI-Tells.

Die Lektion aus Providence gilt für jedes Personalbüro: Ein perfekter Abschluss beweist 2026 gar nichts mehr.
— Michael Dobler, Herausgeber Dr. Web

Was bedeutet das für Recruiting und Weiterbildung im DACH-Raum?

Sieben Papierfiguren in Reihe, eine mit Hut, eine mit orangefarbenem Aufkleber „echt“ — Wenn alle Bewerbungen gleich klingen, zählt nur noch der echte Nachweis.

Die Handlungskonsequenz trifft drei Bereiche zugleich: Recruiting, IHK- und Hochschulzertifikate sowie betriebliche Weiterbildung. Verlassen Sie sich nicht auf KI-Detektoren als Beweismittel. Deutsche Hochschulgutachten stufen deren Ergebnisse als unzuverlässiges Indiz ein, und ein automatisierter Abgleich von Bewerberdaten wirft unter der DSGVO eigene Fragen auf. Eine datensparsame Alternative liefert die lokale Verarbeitung, wie unser Beitrag zu alltagstauglichen lokalen KI-Modellen zeigt.

Setzen Sie auf überprüfbare Verfahren. Strukturierte Interviews, Arbeitsproben und kurze fachliche Rückfragen zum eingereichten Material trennen echtes Können von geliehenen Formulierungen. Verschieben Sie interne Schulungsnachweise von der reinen Wissensabfrage zum praktischen Kompetenznachweis, etwa durch betreute Aufgaben am Arbeitsplatz. Wer die Grundbegriffe dahinter sortieren möchte, findet Orientierung in unserem LLMs-Ratgeber für Entscheider.

Beginnen Sie diese Woche mit einem Schritt: Prüfen Sie, an welcher Stelle Ihr Auswahlprozess heute noch allein auf einem Text fußt, und ersetzen Sie ihn durch eine konkrete Aufgabe.