Ein Menschenrechtsverband erklärt die Datenbasis von ChatGPT, Gemini und Co. für rechtswidrig. Der Vorwurf trifft nicht einzelne Ausreißer, sondern das Fundament der Branche. Für Unternehmen, die generative KI einsetzen, verschiebt sich damit die Haftungsfrage.
drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügenIllegales Web-Scraping bildet laut Amnesty International die Grundlage praktisch aller großen generativen KI-Systeme. Drei Tage nach Veröffentlichung des Berichts diskutiert die Branche, ob das Geschäftsmodell der Datensammlung vor Gericht standhält. Die Organisation legte am 28. Mai 2026 das Briefing „Unlawful by Design“ vor und kommt zu einem harten Schluss.
Das Wichtigste in Kürze
- Amnesty International stuft das massenhafte Sammeln von Trainingsdaten als Eingriff in die Privatsphäre ein, der im Systemdesign angelegt ist.
- Untersucht wurden unter anderem GPT-3 von OpenAI, Googles Gemini, Metas Llama, DeepSeek sowie Midjourney und Stable Diffusion.
- Der Verband fordert Staaten auf, KI-Systeme zu verbieten, die auf rechtswidrigem Scraping beruhen.
- Von acht angeschriebenen Konzernen antworteten nur Microsoft, Amazon, Intel, OpenAI und Meta.
Was wirft Amnesty den KI-Konzernen konkret vor?

Nicht-einvernehmliche Datensammlung steht im Zentrum der Kritik. Die Modelle stützen sich auf Milliarden öffentlicher Online-Posts und Bilder, oft ohne ausdrückliche Zustimmung der Menschen, die darauf zu sehen sind oder die Inhalte erstellt haben. Amnesty beschreibt das als Eingriff in die Privatsphäre, der bereits in der Konstruktion der Systeme angelegt ist.
Verstärkte Diskriminierung sieht der Bericht als zweite Folge. Mit der Größe der Datensätze wachse auch der Anteil hasserfüllter und diskriminierender Inhalte in den Ergebnissen, samt rassistischer und geschlechtsbezogener Stereotype. Likhita Banerji, Leiterin des Algorithmic Accountability Lab bei Amnesty International, ordnet die Praxis scharf ein.
„Unternehmen liefern generative KI-Produkte unter dem Deckmantel von Effizienz, doch in Wahrheit beruhen diese Systeme auf massenhaften Eingriffen in die Privatsphäre durch rechtswidriges Web-Scraping.“ — Likhita Banerji, Leiterin Algorithmic Accountability Lab, Amnesty International
Welche Folgen hat der Bericht für Unternehmen?

Verschobene Haftungsfrage lautet die praktische Konsequenz für Entscheider. Wer generative KI in Produkte oder Prozesse einbaut, baut auf einer Datenbasis auf, deren Rechtmäßigkeit eine große Menschenrechtsorganisation öffentlich bestreitet. Die Debatte über zulässige Trainingsdaten läuft im DACH-Raum parallel zur Diskussion über den Umgang mit KI-Crawlern, die auch Websitebetreiber bei der Crawler-Frage betrifft.
Regulatorischer Druck dürfte zunehmen. Amnesty verlangt von Staaten ein Verbot eigenständiger generativer KI-Systeme, die durch rechtswidriges Scraping entstanden sind, und eine Rechenschaftspflicht der Unternehmen für Menschenrechtsverstöße. Wie sich europäische Fristen entwickeln, zeigt der Überblick zum Digital Omnibus und den verschobenen AI-Act-Fristen. Den Datenhunger der Crawler belegen die Cloudflare-Zahlen zum Trainings-Traffic.
Den vollständigen Befund samt Antworten der angeschriebenen Konzerne dokumentiert das Briefing von Amnesty International. Für Unternehmen im DACH-Raum lohnt der Blick auf die eigene KI-Lieferkette: Welche Modelle kommen zum Einsatz, und auf welcher Datengrundlage stehen sie?
Mehr Newshunger?
