Wer einer KI seine Krankheitssymptome schildert, lässt mehr weg als gegenüber einem Arzt. Eine im Mai 2026 in Nature Health publizierte Würzburger Studie liefert die erste belastbare Datenbasis. Für die geplante KI-Triage in deutschen Arztpraxen ist das eine unerwartete Schwachstelle.
drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügenStellen Sie sich vor, der Chatbot Ihrer Krankenkasse fragt nach Ihren Kopfschmerzen, und Sie geben automatisch eine knappere Antwort als beim Hausarzt. Genau dieser Effekt ist jetzt wissenschaftlich nachgewiesen. Die KI-Triage hat eine Achillesferse, die niemand auf der Rechnung hatte: die Patientinnen und Patienten selbst.
Ein Team um Professor Wilfried Kunde von der Julius-Maximilians-Universität Würzburg hat zusammen mit der Charité Berlin, der University of Cambridge sowie den Berliner Helios- und Vivantes-Kliniken 500 Probanden untersucht. Das Ergebnis ist eindeutig und für die gesamte digitale Erstberatung im deutschen Gesundheitswesen relevant.
Das Wichtigste in Kürze
- Studie der Universität Würzburg, publiziert am 1. Mai 2026 in Nature Health
- 500 Probanden schrieben simulierte Symptomberichte zu Kopfschmerzen und Grippe
- Berichte an einen vermeintlichen Chatbot waren signifikant kürzer und weniger detailliert als Berichte an einen vermeintlichen Arzt
- Durchschnittliche Differenz: 28 Zeichen pro Bericht — klein, aber laut Studienteam folgenreich
- Hauptursache: psychologischer Effekt der „Vernachlässigung der Einzigartigkeit“ (Uniqueness Neglect)
Wie die Würzburger Studie das Verhalten gemessen hat

Die 500 Teilnehmenden bekamen die Aufgabe, simulierte Symptomberichte für zwei verbreitete Krankheitsbilder zu verfassen: ungewöhnliche Kopfschmerzen und Grippe. Vor dem Schreiben wurde ihnen mitgeteilt, dass entweder ein KI-Chatbot oder ein menschlicher Arzt den Bericht später lesen würde. Beide Gruppen erhielten identische Hinweise zur erwünschten Detailtiefe. Das Forschungsteam um Erstautor Moritz Reis maß anschließend die Berichtsqualität, gemessen an der Eignung der Texte für eine medizinische Dringlichkeitseinschätzung.
Die Berichte an die vermeintlich künstliche Intelligenz fielen im Durchschnitt 28 Zeichen kürzer aus. Klingt nach wenig, ist aber laut Studienteam von Bedeutung: Selbst leistungsfähige KI-Modelle könnten bei lückenhaften Angaben falsche Empfehlungen geben. Das gilt unabhängig vom verwendeten Modell, von leistungsstarken LLMs bis hin zu spezialisierten Triage-Systemen, die in deutschen Praxen gerade eingeführt werden.
Warum Patienten gegenüber Maschinen anders erzählen

Der psychologische Mechanismus dahinter heißt in der Fachsprache „Uniqueness Neglect“, die Vernachlässigung der Einzigartigkeit. Viele Menschen unterstellen einer Maschine, dass sie die individuellen Nuancen ihrer Situation ohnehin nicht erfassen kann. Folge: weniger Mühe beim Schildern. Wer überzeugt ist, sowieso in eine Schublade gesteckt zu werden, gibt sich nicht die Mühe, das passende Etikett präzise zu beschreiben.
Das Forschungsteam betont eine zweite Komponente: das Gefühl, vor einer Maschine kein Gesicht verlieren zu können. Was bei sensiblen Themen wie psychischer Gesundheit oder Sexualanamnese eigentlich helfen sollte, kippt hier ins Gegenteil. Die Hemmschwelle sinkt nicht bei den Inhalten, sondern beim Aufwand der Schilderung.
Wer in einer deutschen Arztpraxis 2026 eine KI-Triage einführt, schaltet damit nicht automatisch einen besseren Arzt vor. Die Würzburger Studie zeigt: Das Problem ist nicht das Modell, sondern die Art und Weise, wie wir Menschen mit Maschinen reden. Wer das ignoriert, baut sich teure Fehldiagnosen direkt in den Workflow ein.
— Markus Seyfferth, Chefredakteur Dr. Web
Was deutsche Praxen und Telemedizin jetzt prüfen müssen

Hat das Konsequenzen? Ja. Zunächst die Konversationsführung: Triage-Chatbots brauchen aktive Nachfragen, statt sich auf den ersten Bericht zu verlassen. Wer pauschal „Bitte schildern Sie Ihre Beschwerden“ abfragt, bekommt das halbe Bild. Strukturierte Folgefragen mit konkreten Detailaufforderungen heben die Berichtsqualität messbar an.
Parallel dazu der Vertrauensaufbau: Praxen sollten transparent kommunizieren, wer die Antworten am anderen Ende der Leitung wirklich liest. Wenn ein Arzt die KI-Berichte später kontrolliert, hebt allein dieses Wissen die Detailtiefe an. Schließlich die Schulung: Mitarbeitende in Praxen und Klinik-Hotlines müssen wissen, dass Patienten der KI eher misstrauen als dem Telefondienst. Wer den Übergang gestaltet, vermeidet Lücken. Wie sich der gesamte Suchverkehr durch KI-Antworten verändert, zeigt unser Hintergrund zu LLMs gegen Google. Wer KI-Triage einkauft, sollte zudem die GEO-Mechanik moderner Sprachmodelle kennen, um Anbieter realistisch zu bewerten.
Mehr Newshunger?
