KI Halluzinationen haben einen Anwalt vor Gericht blamiert, eine Fluggesellschaft Geld gekostet und ein Reiseportal Quellen erfinden lassen, die niemand je geschrieben hat. Ein Sprachmodell behauptet ungeniert, Deutschland habe die EM 2021 gewonnen, formuliert sauber und liegt komplett daneben. Die Frage dahinter ist keine Geschmacksfrage, sondern eine über die Bauart der Technik.

drweb.de als bevorzugte Quelle auf Google hinzufügenQualitätsgeprüfte Inhalte direkt in Google News & DiscoverJetzt hinzufügen

KI Halluzinationen treffen Sie dort an, wo Sie es am wenigsten erwarten. Ein Sprachmodell antwortet nie mit einem Schulterzucken. Sie fragen nach einer Quelle, einer Jahreszahl, einem Paragraphen, und zurück kommt eine Antwort wie aus dem Lehrbuch.

Nur stimmt sie manchmal nicht. Diese Mischung aus Tempo, Eloquenz und gelegentlichem Totalausfall macht das Phänomen so gefährlich für jeden, der KI im Betrieb einsetzt.

Das Wichtigste in Kürze

  • KI Halluzinationen sind selbstbewusst vorgetragene Falschaussagen eines Sprachmodells, die plausibel klingen, aber keine Grundlage in den Fakten haben
  • Die Ursache steckt im Bauprinzip: Sprachmodelle schätzen Wahrscheinlichkeiten für Wortfolgen und besitzen kein Wissen im menschlichen Sinn
  • OpenAI hat 2025 nachgewiesen, dass gängige Trainings- und Bewertungsverfahren das Raten belohnen und ehrliche Unsicherheit bestrafen
  • Die Rate sinkt von Modellgeneration zu Modellgeneration, eine vollständige Beseitigung gilt nach heutigem Forschungsstand als mathematisch ausgeschlossen

Neulich beim Psychiater…

Wissenstest
Die KI auf der Couch: Was wissen Sie über Halluzinationen?
5 Fragen aus dem Artikel. Wählen Sie Ihre Antwort, dann decken Sie die Lösung auf. Der Patient liegt schon bereit.
1 „Doktor, ich erfinde Dinge, die so echt klingen.“ Was beschreibt eine KI-Halluzination am besten? Aufklappen ↓
Auflösung aufdecken ↓
Richtig: B. Eine Halluzination ist eine plausibel klingende, aber faktisch falsche oder frei erfundene Aussage. Das Modell nimmt nichts wahr, sondern berechnet wahrscheinliche Wortfolgen. Mehr dazu im Kapitel „Was genau passiert bei einer KI Halluzination?“.
2 „Warum passiert mir das ständig?“ Was ist die tiefere Ursache für Halluzinationen? Aufklappen ↓
Auflösung aufdecken ↓
Richtig: A. Sprachmodelle speichern kein Wissen, sondern statistische Gewichtungen, und schätzen die wahrscheinlichste Wortfolge. Fehlt eine Information, füllen sie die Lücke mit dem statistisch Naheliegendsten. Siehe Kapitel „Warum halluziniert KI überhaupt?“.
3 „Man hat mir beigebracht zu raten.“ Was zeigte die OpenAI-Forschung von 2025? Aufklappen ↓
Auflösung aufdecken ↓
Richtig: C. Wie bei einem Multiple-Choice-Test bringt Raten im Erwartungswert mehr Punkte als ein ehrliches „Ich weiß es nicht“. Werden Modelle nur nach Genauigkeit bewertet, lernen sie zu raten. Nachzulesen im Kapitel „Warum belohnt das Training ausgerechnet das Raten?“.
4 „Werde ich jemals geheilt?“ Verschwinden KI-Halluzinationen nach heutigem Stand ganz? Aufklappen ↓
Auflösung aufdecken ↓
Richtig: B. OpenAI bezeichnet Halluzinationen als reduzierbar, aber nicht eliminierbar. Die Genauigkeit erreicht nie hundert Prozent, weil manche Fragen grundsätzlich unbeantwortbar sind. Die Rate sinkt aber von Generation zu Generation. Siehe Kapitel „Werden KI Halluzinationen jemals verschwinden?“.
5 „Was raten Sie mir für den Alltag?“ Wie senken Unternehmen das Halluzinationsrisiko am besten? Aufklappen ↓
Auflösung aufdecken ↓
Richtig: A. RAG bindet das Modell an geprüfte eigene Dokumente, klare Prompts erlauben ein ehrliches „Ich weiß es nicht“, und eine Prüfschicht fängt Restfehler ab. Bei kritischen Anwendungen bleibt die menschliche Endkontrolle Pflicht. Siehe Kapitel „Was bedeutet das für Ihre Entscheidungen im Unternehmen?“.

 

Was genau passiert bei einer KI Halluzination?

Roboter hält Pappschild mit „Ganz sicher!“, Fragezeichen fliegen aus Kopf
Sprachmodelle erzeugen fließend wirkende, aber faktisch falsche oder erfundene Inhalte, wenn sie von vorgegebenen Quellen abweichen

Der Begriff führt in die Irre. Eine Maschine sieht keine rosa Elefanten und hört keine Stimmen.

Gemeint ist etwas Nüchterneres. Ein Sprachmodell erzeugt einen Inhalt, der flüssig und überzeugend wirkt, aber faktisch falsch oder frei erfunden ist. Das Fraunhofer IESE definiert das als Abweichung von den vorgegebenen Quellen.

Manche Fachleute bevorzugen deshalb das Wort Konfabulation. Der Vergleich trägt weiter, denn eine Konfabulation beschreibt in der Psychologie eine erfundene Erinnerung, die der Mensch für bare Münze nimmt.

Von Lügen zu sprechen, geht an der Sache vorbei. Eine Lüge verlangt, dass jemand die Wahrheit kennt und bewusst abweicht. Ein Sprachmodell kennt die Wahrheit gar nicht, also kann das Modell auch nicht lügen.

Wichtig bleibt die Abgrenzung, weil sie in der Praxis oft verschwimmt. Wer eine schludrige Frage stellt und eine schiefe Antwort erntet, hat keine Halluzination erlebt, sondern ein Missverständnis.

Eine echte Halluzination entsteht erst, wenn das Modell auf solider Wissensbasis trotzdem etwas Erfundenes zusammensetzt, das richtig klingt. Genau diese Tarnung im plausiblen Gewand unterscheidet die Halluzination vom simplen Fehler.

Prabhakar Raghavan, lange Leiter von Google Search, hat das einmal als überzeugend formulierte, aber weitgehend erfundene Resultate beschrieben. Die Einschätzung kommt vom Mann, dessen Suchmaschine selbst mit dem Problem ringt. Das Überzeugende ist der Kern des Problems, kein Nebeneffekt.

Kommt Ihnen das bekannt vor?

KI Halluzinationen
Die KI blufft so menschlich wie wir

Eine KI, die etwas erfindet, statt „weiß ich nicht“ zu sagen, verhält sich erstaunlich menschlich. Wir tun im Zweifel nämlich dasselbe. Und genau wie bei uns hängt die Trefferquote davon ab, wie gut der Wissensstand ist.

„Keine Ahnung, ehrlich gesagt.“ „Klar, also im Grunde ist es so…“
Dieselbe Reaktion, zwei Spieler

Niemand sagt gern „ich weiß es nicht“. Wir bauen lieber darauf, dass das Gegenüber noch weniger Ahnung hat. Die KI macht es genauso, nur schneller.

Der Mensch
Im Meeting Redet souverän über eine Zahl, die er nicht kennt, weil Schweigen schwächer wirkt als ein selbstbewusster Bluff.
In der Prüfung Kreuzt irgendwas an, weil Leerlassen sicher null Punkte bringt und Raten wenigstens eine Chance.
Beim Smalltalk Tut so, als kenne er den Film, und füllt die Lücke mit dem, was am plausibelsten klingt.
vs.
Die KI
Bei einer Quellenfrage Nennt eine Studie samt Autor mit voller Überzeugung, obwohl die Arbeit nie erschienen ist.
Im Benchmark Rät statt sich zu enthalten, weil gängige Tests das Raten belohnen und ehrliche Unsicherheit bestrafen.
Bei einer Wissenslücke Füllt die Lücke mit der statistisch wahrscheinlichsten Wortfolge, nicht mit der Wahrheit.
So gut wie der Wissensstand

Ein Mensch mit aktuellen Fakten irrt seltener als einer, der aus dem Bauch raten muss. Bei der KI ist es identisch: Trainingsstand und Live-Zugriff entscheiden über die Trefferquote.

Ohne Live-Zugriff

Die KI schöpft nur aus ihrem alten Trainingsstand. Bei allem Neueren rät sie, genau wie ein Mensch, der mit veraltetem Wissen mitreden will.

Mit Live-Zugriff (RAG)

Die KI holt vor der Antwort geprüfte, aktuelle Dokumente und stützt sich darauf. Die Fehlerquote sinkt spürbar, wie bei jemandem, der erst nachschlägt und dann redet.

Seltener ja, nie ganz weg

Bessere Quellen und ein aktueller Wissensstand senken die Fehlerquote, beim Menschen wie bei der Maschine. Auf null bringt sie niemand. OpenAI nennt Halluzinationen reduzierbar, aber nicht eliminierbar. Deshalb bleibt die menschliche Endkontrolle Pflicht.

 

Welche Arten von Halluzinationen gibt es?

Keramikkrug mit der Aufschrift „Halluzinations-Klassifizierer“ und zwei Spiegeleiern davor
Faktizitäts-Halluzinationen entstehen, wenn KI-Modelle falsche Aussagen über die reale Welt treffen oder fiktive Studien erfinden

Nicht jede Halluzination funktioniert gleich. Die Forschung trennt zwei Grundtypen, und die Unterscheidung hilft bei der Einschätzung des Risikos.

Der erste Typ heißt Faktizitäts-Halluzination. Hier widerspricht die Ausgabe dem Wissen über die reale Welt. Das Modell behauptet etwa, ein schwarzes Loch erzeuge sein Magnetfeld durch Gravitation, oder erfindet eine Studie samt Autoren, die nie erschienen ist.

Der zweite Typ heißt Treue-Halluzination (englisch faithfulness). Hier weicht das Modell von der Vorlage ab, die der Nutzer selbst geliefert hat. Sie geben einen Text zum Zusammenfassen, und in der Zusammenfassung tauchen Details auf, die im Original gar nicht standen.

Die zweite Sorte ist tückischer, weil die Quelle vorliegt und das Ergebnis trotzdem davon abdriftet. Beim Faktizitätsfehler hilft Fachwissen, beim Treuefehler nur der mühsame Abgleich mit dem Ausgangstext.

Hinzu kommt eine Eigenheit auf der Ebene der kleinsten Bausteine. Sprachmodelle zerlegen Text in Token, also Wörter oder Wortteile. Bestimmte Token-Typen verwechselt das Modell besonders gern, weil die statistische Nähe groß und der inhaltliche Unterschied klein ist:

  • Ähnliche Zahlenwerte, etwa zwei dicht beieinanderliegende Preise
  • Nah benachbarte Jahreszahlen wie 2020 und 2021
  • Ähnlich klingende Eigennamen
  • Technische Abkürzungen aus demselben Fachgebiet

Diese vier Fallen nennt das Fraunhofer IESE als typische Auslöser. Wer eine KI-Antwort prüft, sollte genau bei Zahlen und Namen zweimal hinsehen.

HalluzinationstypWas widerspricht wemTypisches BeispielSchwer erkennbar?
FaktizitätAussage gegen reale WeltErfundene Studie, falsches PhysikgesetzNur mit Fachwissen
Treue (faithfulness)Ausgabe gegen gelieferte QuelleZusammenfassung enthält ErfundenesJa, Quelle muss verglichen werden
Logische InkonsistenzAussage gegen eigene vorherige AussageWiderspruch im selben AntworttextMittel, bei genauem Lesen

Warum halluziniert KI überhaupt?

Ein weißer Roboter mit Mütze betrachtet einen Flamingo aus Wolle mit einem kleinen Schild
Sprachmodelle speichern Informationen als statistische Gewichtungen und generieren bei Anfragen die wahrscheinlichste Wortfolge, keine faktischen Aussagen

Die kurze Antwort steckt in der Bauart. Ein Sprachmodell speichert Informationen nicht als saubere Faktenkartei, sondern als statistische Gewichtungen zwischen Konzepten.

Bei jeder Anfrage berechnet das System, welches Wort mit der höchsten Wahrscheinlichkeit als nächstes folgt. Erzeugt wird also keine Tatsache, sondern eine wahrscheinliche Wortfolge. Wie diese Mustererkennung im Maschinenraum arbeitet, beschreibt unser Beitrag zum KI-Algorithmus als Gehirn hinter smarten Systemen.

Solange die wahrscheinlichste Wortfolge auch die wahre ist, merkt niemand etwas. An den Rändern des Wissens kippt das Verfahren.

Fehlt dem Modell eine Information, hält das System nicht inne, sondern füllt die Lücke mit dem statistisch Naheliegendsten. Diese Lückenfüllung macht Sprachmodelle beim Brainstorming brauchbar und im Faktenkontext gefährlich. Stärke und Schwäche haben dieselbe Wurzel.

Mehrere Faktoren verschärfen die Lage. Am Anfang stehen die Trainingsdaten:

  • Sind sie lückenhaft, fehlen dem Modell ganze Wissensgebiete
  • Sind sie veraltet, kennt das Modell neuere Entwicklungen nicht
  • Sind sie verzerrt, übernimmt das Modell die Schieflage und gibt sie weiter

Google Cloud nennt zusätzlich die fehlende Erdung, das sogenannte Grounding. Ein Modell ohne festen Bezug zu geprüftem Faktenwissen erzeugt Ausgaben bis hin zu erfundenen Links auf Seiten, die nie existiert haben.

Ein zweiter Faktor sitzt in der Generierung selbst. Die Dekodierung arbeitet mit Zufallselementen, damit die Antworten nicht stur ausfallen. Zu viel Zufall treibt das Modell in unplausible Aussagen, zu wenig in langweilige Standardfloskeln.

Der dritte Faktor wiegt schwer und wird oft übersehen. Dem Modell fehlt jede direkte Erfahrung der physischen Welt. Cloudflare bringt das auf den Punkt, indem es daran erinnert, dass ein Mensch ein Prinzip notfalls im Experiment prüft, eine KI dagegen nur an vorhandenen Texten lernt.

Bleibt die Frage, warum der Unsinn so souverän daherkommt. Die Antwort liegt im Trainingsziel. Modelle werden auf flüssigen Text optimiert, nicht auf Demut, und eine saubere Sprachform tarnt den faktischen Aussetzer. Wer schön spricht, dem glaubt man eher, bei Maschinen wie bei Menschen.

Warum belohnt das Training ausgerechnet das Raten?

Grüner Pokal mit Aufziehschlüssel und Text
OpenAI-Forschung zeigt: Sprachmodelle halluzinieren, weil Trainingsmethoden das Raten belohnen statt Unsicherheit zuzugeben

An diesem Punkt wird die Sache spannend, weil sie der landläufigen Erwartung widerspricht. Im September 2025 hat OpenAI eine Forschungsarbeit mit dem Titel „Why Language Models Hallucinate“ vorgelegt.

Die Kernaussage der Autoren rund um OpenAI sitzt unbequem: Sprachmodelle halluzinieren, weil die üblichen Verfahren bei Training und Bewertung das Raten belohnen und das Eingeständnis von Unsicherheit bestrafen.

Der Vergleich, den die Forscher wählen, stammt aus dem Klassenzimmer. Denken Sie an einen Multiple-Choice-Test:

  • Leere Antwort: garantiert null Punkte
  • Geratene Antwort: eine echte Chance, zufällig richtigzuliegen
  • Im Erwartungswert lohnt sich das Raten also fast immer

Jeder Prüfling lernt diese Logik spätestens in der Mittelstufe. Sprachmodelle stehen vor genau demselben Anreiz.

Werden sie allein nach Genauigkeit bewertet, nach dem Anteil exakt richtiger Antworten, dann zahlt sich Raten aus. Fragt man ein Modell nach dem Geburtstag einer unbekannten Person, liegt die Trefferchance beim blinden Raten eines Datums bei eins zu 365.

Ein ehrliches „Ich weiß es nicht“ bringt dagegen sichere null Punkte. Das System lernt daraus die falsche Lektion, nämlich lieber zu raten als zu schweigen.

Die Zahlen aus dem Papier zeigen den Preis dieser Logik. Das ältere Modell OpenAI o4-mini erreichte eine Enthaltungsrate von nur einem Prozent, eine Genauigkeit von 24 Prozent und gleichzeitig eine Fehlerrate von 75 Prozent.

Das Modell ratete also bei fast allem mit, gewann dadurch ein paar Prozentpunkte Genauigkeit und handelte sich eine massive Fehlerquote ein. Genau dieser Tausch steckt eingebaut in viele verbreitete Benchmarks.

Solange ein Benchmark Raten höher bewertet als ein ehrliches Achselzucken, optimieren die Hersteller ihre Modelle genau in diese Richtung. Wer KI Halluzinationen wirklich senken will, muss zuerst die Spielregeln der Bewertung ändern und nicht bloß das nächste Modell größer bauen.

— Markus Seyfferth, Chefredakteur Dr. Web

Ein zweiter Befund der OpenAI-Analyse reicht tiefer. Halluzinationen entstehen schon in der Grundlogik des Lernens, nicht erst beim Feinschliff.

Die Forscher führen die Generierungsfehler auf eine simple Hilfsfrage zurück, das Is-It-Valid-Problem: „Ist diese Antwort gültig?“ Eine Antwort selbst zu erzeugen ist statistisch immer fehleranfälliger, als nur zu prüfen, ob eine fertige Antwort stimmt.

Daraus folgt eine mathematische Untergrenze für Fehler, die sich nicht auf null drücken lässt. Diese Untergrenze ist der Grund, warum die ehrliche Antwort auf Ihre Titelfrage ernüchternd ausfällt.

Werden KI Halluzinationen jemals verschwinden?

Federhalter zeichnet mit oranger Flüssigkeit über Flakon mit derselben Flüssigkeit
Eine ehrliche Antwort zu Halluzinationen in KI-Systemen hat zwei Schichten: Sie lassen sich reduzieren, aber nicht vollständig eliminieren

Damit zur eigentlichen Frage. Die ehrliche Antwort hat zwei Schichten, und wer nur eine davon hört, bekommt ein falsches Bild.

Schicht eins fällt unbequem aus. Vollständig verschwinden werden Halluzinationen nach heutigem Stand nicht. OpenAI formuliert das selbst klar: erklärbar, messbar, reduzierbar, aber nicht eliminierbar.

Der Grund liegt nicht in einem Programmierfehler, den irgendwann jemand behebt, sondern in der Natur der Aufgabe. Die Genauigkeit erreicht nie hundert Prozent, weil manche realen Fragen unabhängig von Modellgröße und Rechenleistung grundsätzlich unbeantwortbar sind.

Schicht zwei klingt zuversichtlicher. Die Rate sinkt sichtbar von Generation zu Generation. OpenAI gibt an, dass GPT-5 deutlich seltener halluziniert als die Vorgänger, besonders beim Reasoning.

Und es existiert ein Hebel, der nichts mit größeren Modellen zu tun hat. Ein kleines Modell kann seine Grenzen sogar leichter kennen als ein großes.

Fragt man ein kleines Modell etwas auf Māori und es beherrscht die Sprache nicht, sagt es schlicht „Ich weiß es nicht“. Ein Modell mit Halbwissen muss erst die eigene Sicherheit einschätzen, und genau dabei verschätzt es sich.

Der entscheidende Satz aus der Forschung lautet: Kalibriert zu sein verlangt weniger Rechenleistung als genau zu sein. Ein Modell muss nicht allwissend werden, um seltener danebenzugreifen, sondern lernen, die eigene Unsicherheit ehrlich zu beziffern.

Wir betrachten das mit gesunder Skepsis. Das öffentliche Versprechen und die Messdaten klaffen auseinander. Wer monatlich „noch schlauer, vertrau uns mehr“ hört, sollte einen nüchternen Blick auf die Benchmarks werfen.

Eine im Frühjahr 2026 zitierte Forscherbefragung deutet darauf hin, dass eine breite Mehrheit die Gewinne aus reinem Hochskalieren für ausgereizt hält. Mehr Daten und mehr Chips allein lösen das Problem nicht mehr, das räumen inzwischen selbst Stimmen aus den großen Laboren ein.

Warum halluzinieren ausgerechnet die schlauen Modelle mehr?

Weißer Roboter ohne Kopf, aus dessen Hals eine orange Wolke mit Text „TAGTRÄUMEREI“ aufsteigt
Reasoning-Modelle erzeugen beim Zusammenfassen von Dokumenten häufiger erfundene Inhalte als einfachere Vorgängermodelle, zeigt das Vectara HHEM-Leaderboard

Hier wartet die Überraschung, die der Intuition widerspricht. Die als besonders fähig vermarkteten Reasoning-Modelle schneiden bei einer wichtigen Aufgabe schlechter ab als simplere Vorgänger.

Das Vectara HHEM-Leaderboard misst, wie oft ein Modell beim Zusammenfassen eines Dokuments Inhalte erfindet, die in der Vorlage nicht stehen. Auf dem anspruchsvolleren Datensatz von Ende 2025 überschritten GPT-5, Claude Sonnet 4.5 und Grok-4 jeweils die Zehn-Prozent-Marke.

Das frisch veröffentlichte Gemini-3-Pro lag laut Vectara bei 13,6 Prozent und verfehlte damit sogar die Top 25. Ausgerechnet die Spitzenmodelle landen hier hinten.

Die Erklärung der Forscher klingt kurios und leuchtet beim zweiten Lesen ein. Reasoning-Modelle stecken Rechenarbeit ins Durchdenken einer Antwort.

Beim reinen Zusammenfassen führt dieses Mitdenken dazu, dass das Modell eigene Schlüsse zieht und über die Quelle hinausschießt. Je angestrengter das Modell denkt, desto eher wandert es in die eigene Vorstellung ab.

Klug sein und quellentreu sein, das sind zwei verschiedene Tugenden, und die zweite leidet manchmal unter der ersten. Für die Praxis folgt daraus eine konkrete Lehre über die Werkzeugwahl.

Reasoning hilft bei Analyse, Diagnose und verschachtelten Fragen. Bei Zusammenfassung und quellentreuen Aufgaben schadet das Mitdenken eher. Die folgende Übersicht ordnet die gängigen Hebel gegen Halluzinationen ein.

HebelWie er wirktRealistische Wirkung
RAG (Retrieval-Augmented Generation)Modell bekommt vor der Antwort echte Quelldokumente vorgelegtSenkt Halluzinationen deutlich, beseitigt sie nicht
Kalibrierung auf UnsicherheitModell lernt, ehrlich „Ich weiß es nicht“ zu sagenGroßer Effekt bei geringem Rechenaufwand
VerifikationsschichtZweites Modell prüft die Antwort des erstenFängt einen erheblichen Teil der Fehler ab
Präzises PromptingAnweisung, Quellen zu nennen oder Unsicherheit zuzugebenSpürbar, ersetzt keine Endkontrolle
Reasoning gezielt abschaltenVerhindert das Abdriften bei ZusammenfassungenAufgabenabhängig, kein Allheilmittel

Eine Warnung gehört zu den Benchmark-Zahlen dazu. Die Werte einzelner Modelle schwanken je nach Test erheblich.

Auf einem einfachen Datensatz mit kurzen Texten glänzen viele Modelle mit Raten unter drei Prozent, auf einem schwierigen mit langen Fachdokumenten brechen dieselben Modelle ein. Eine einzelne Prozentzahl taugt deshalb nie als Endurteil.

Wer Modelle ernsthaft vergleicht, legt mindestens zwei unabhängige Benchmarks nebeneinander und misstraut jeder Werbefolie mit nur einer Zahl.

Was kostet eine Halluzination im echten Betrieb?

Oranges Sparschwein mit der Aufschrift „WAS KOSTET EINE HALLUZINATION?“, aus dem Geldscheine in Form von Fabelwesen ragen
Anwalt zitiert erfundene Urteile, Chatbot lobt Eiffelturm in Berlin, KI-Systeme erfinden Fakten über Teleskope

Die Theorie wird greifbar, sobald Geld und Haftung ins Spiel kommen. Die Beispiele aus der Praxis sind inzwischen Lehrstücke:

  • Ein Anwalt reichte einen Schriftsatz ein, dessen zitierte Gerichtsurteile schlicht nicht existierten
  • Ein Reise-Chatbot pries den Eiffelturm in Berlin an
  • Der Google-Vorgänger Bard behauptete fälschlich, das James-Webb-Teleskop habe das erste Bild eines Exoplaneten geliefert

Der Bard-Patzer kostete den Mutterkonzern an einem einzigen Handelstag Milliarden an Börsenwert. Eine einzige falsche Aussage in einer Werbedemo reichte.

Vor deutschen Gerichten ist das Thema angekommen. Das Landgericht Frankfurt hielt in einem Beschluss vom September 2025 fest, dass eingereichte Fälschungen womöglich von einem Chatbot halluziniert worden seien.

Schwerer wiegt eine Entscheidung des Oberlandesgerichts Hamm aus dem Mai 2026. Der Betreiber eines KI-Chatbots haftet demnach für dessen Inhalte, auch wenn er selbst keine fehlerhaften Daten eingespeist hat.

Die Verantwortung lässt sich also nicht bequem an den Modellhersteller durchreichen. Sie bleibt beim Anwender, der die KI einsetzt.

Ein Rechenbeispiel macht die Größenordnung greifbar. Angenommen, ein Modell halluziniert bei zehn von hundert Zusammenfassungen, und Ihr Team verarbeitet 500 Dokumente am Tag. Dann wären das rechnerisch rund 50 fehlerhafte Zusammenfassungen täglich, von denen mehrere unbemerkt durchrutschen könnten.

Bei 250 Arbeitstagen ergäbe das eine Größenordnung, die kein seriöser Betrieb mit einem Achselzucken abtun sollte. Die Zahl ist hypothetisch, das Risiko ist real.

Dahinter steht eine ernüchternde Forschungsdebatte. Der KI-Pionier Yann LeCun argumentiert seit Jahren, dass große Sprachmodelle grundsätzliche Grenzen haben und ein anderer Ansatz nötig sei.

Ob die nächste Architektur den Durchbruch bringt, weiß heute niemand seriös zu sagen. Sicher ist nur, dass die einfache Rechnung „mehr Rechenpower gleich weniger Halluzination“ an ihre Grenze stößt.

Was bedeutet das für Ihre Entscheidungen im Unternehmen?

Kompass mit einer Möhre als Nadel liegt auf einem Business Plan 2024 Buch
Sprachmodelle als fehleranfällige Werkzeuge nutzen: Kritische Überprüfung statt blindes Vertrauen verhindert teure Fehler

Aus der Faktenlage folgt eine nüchterne Haltung, weder Panikmache noch Technikgläubigkeit. Behandeln Sie ein Sprachmodell wie einen sehr schnellen Werkstudenten, der gelegentlich felsenfest etwas Falsches behauptet, und eben nicht wie eine Datenbank zum blinden Abfragen.

Diese eine Faustregel erspart die meisten teuren Fehler. Für den betrieblichen Einsatz heißt das zunächst eine klare Pflicht zur Endkontrolle.

Überall dort, wo eine falsche Aussage Schaden anrichtet, bleibt der Mensch in der Verantwortung. In Medizin, Recht, Finanzen und Technik kostet eine Halluzination im Zweifel mehr, als die Zeitersparnis je einbringt.

Drei Maßnahmen senken das Risiko spürbar, ohne ein Vermögen zu verschlingen:

  1. Retrieval-Augmented Generation bindet das Modell an Ihre eigenen, geprüften Dokumente, sodass das System aus kontrollierter Quelle schöpft
  2. Prompts, die Unsicherheit ausdrücklich erlauben, holen das ehrliche „Ich weiß es nicht“ aus dem Modell heraus
  3. Eine Prüfschicht aus einem zweiten Modell oder einem Fachmenschen fängt verbliebene Fehler ab

Studien beziffern den Effekt solcher Verifikation auf einen Anteil von dreißig bis fünfzig Prozent abgefangener Fehler, je nach Aufbau. Kein Allheilmittel, aber ein handfester Gewinn für überschaubaren Aufwand.

Die Technik wird besser, daran besteht kein Zweifel. Fehlerfrei wird sie nach heutigem Stand nicht.

Ob Halluzinationen in zehn Jahren noch ein Alltagsthema sind, hängt weniger an der Rechenleistung als an der Frage, ob die Branche ihr Belohnungssystem umbaut. Wo die harten Grenzen der Technik wirklich verlaufen und welche davon nur weiche sind, haben wir in der Analyse zu den 99 Dingen, die KI angeblich nie können wird, Punkt für Punkt geprüft.

Dort zeigt sich ein Muster, das auch hier greift. Vieles, was als „niemals“ galt, ist längst gefallen, doch die Pflicht zur menschlichen Endkontrolle hat ein anderes Verfallsdatum als die rein technischen Grenzen.

Wer das Phänomen historisch einordnen mag, findet eine Perspektive in unserem Beitrag zur Logik hinter 4.000 Jahren KI und Automatisierung. Jede Technikwelle brachte ihre Kinderkrankheiten mit, und jede wurde beherrschbar, ohne je völlig perfekt zu werden.

Die KI macht da keine Ausnahme. Sie wird zähmbar, nicht makellos, und der kluge Umgang besteht darin, mit diesem Rest an Unzuverlässigkeit zu planen statt gegen ihn anzuhoffen.

Glossar: 13 wichtige Fachbegriffe zu KI Halluzinationen

Drei gestapelte Bücher mit Titel „KI HALLUZINATIONEN“, rosa Elefant, orangefarbenes Lesezeichen
Standardisierte Tests wie SimpleQA messen, wie häufig KI-Modelle Inhalte erfinden. Verschiedene Benchmarks liefern unterschiedliche Ergebnisse

Benchmark

Benchmark ist ein standardisierter Test, mit dem die Leistung von KI-Modellen vergleichbar wird. Bei Halluzinationen messen Benchmarks wie SimpleQA oder das Vectara HHEM-Leaderboard, wie oft ein Modell Inhalte erfindet. Verschiedene Benchmarks liefern oft abweichende Werte, weil sie unterschiedliche Aufgaben prüfen.

Dekodierung

Dekodierung bezeichnet den Vorgang, mit dem ein Sprachmodell aus berechneten Wahrscheinlichkeiten den fertigen Text erzeugt. Arbeitet die Dekodierung mit zu viel Zufall, steigt die Gefahr unplausibler und damit halluzinierter Ausgaben.

Enthaltungsrate

Enthaltungsrate beschreibt, wie oft ein Modell eine Antwort verweigert und stattdessen Unsicherheit einräumt. Eine höhere Enthaltungsrate senkt tendenziell die Halluzinationen, weil das Modell beim Nichtwissen nicht ins Raten verfällt.

Faktentreue

Faktentreue (englisch factual consistency) misst, wie genau eine Modellantwort mit den zugrunde liegenden Fakten oder Quelldokumenten übereinstimmt. Sie bildet den Gegenpol zur Halluzinationsrate.

Grounding

Grounding bezeichnet die Verankerung eines Modells in geprüftem Faktenwissen oder konkreten Quellen. Fehlt diese Erdung, erzeugt das Modell leichter Ausgaben ohne reale Grundlage. Grounding gilt als wichtiger Ansatz gegen Halluzinationen.

Inferenz

Inferenz ist die Phase, in der ein trainiertes Modell aus einer Eingabe eine Antwort erzeugt. Sobald Sie eine Frage eingeben, läuft die Inferenz. Viele Halluzinationen entstehen genau in diesem Schritt durch die gewählte Dekodierungsstrategie.

Kalibrierung

Kalibrierung bezeichnet die Fähigkeit eines Modells, die eigene Unsicherheit realistisch einzuschätzen. Ein gut kalibriertes Modell erkennt, wann es etwas nicht weiß, und sagt das auch. Kalibrierung gilt als rechensparsamer Hebel gegen Halluzinationen.

Konfabulation

Konfabulation ist der fachlich präzisere Begriff für KI-Halluzination. In der Psychologie meint Konfabulation eine erfundene Erinnerung, die der Mensch für echt hält. Übertragen auf KI beschreibt der Begriff erfundene Inhalte ohne reale Grundlage.

Large Language Model (LLM)

Large Language Model, deutsch großes Sprachmodell, ist ein KI-Modell, das auf riesigen Textmengen trainiert wurde und Sprache durch Wahrscheinlichkeitsberechnung erzeugt. ChatGPT, Gemini und Claude beruhen auf solchen Modellen.

Reasoning-Modell

Reasoning-Modell ist ein Sprachmodell, das vor der Antwort Rechenarbeit in mehrstufiges Schließen investiert. Solche Modelle glänzen bei Analyseaufgaben, neigen aber beim reinen Zusammenfassen dazu, über die Quelle hinauszuschießen und dadurch mehr zu halluzinieren.

Retrieval-Augmented Generation (RAG)

Retrieval-Augmented Generation verbindet ein Sprachmodell mit einer externen Wissensquelle. Vor der Antwort holt das System passende Dokumente und stützt die Ausgabe darauf. RAG senkt Halluzinationen deutlich, weil das Modell aus geprüftem Material schöpft statt aus dem Gedächtnis.

Token

Token ist die kleinste Verarbeitungseinheit eines Sprachmodells, meist ein Wort oder Wortteil. Bestimmte Token-Typen wie ähnliche Zahlen oder nah benachbarte Daten sind besonders anfällig für Verwechslungen und damit für Halluzinationen.

Trainingsdaten

Trainingsdaten sind die Texte, mit denen ein Modell lernt. Sind sie lückenhaft, veraltet oder verzerrt, übernimmt das Modell diese Schwächen. Mangelhafte Trainingsdaten zählen zu den häufigsten Ursachen für Halluzinationen.

FAQ: Werden KI Halluzinationen jemals verschwinden?

Ein weißes Gehirnmodell aus Porzellan mit einer Pflanze und Blüten auf weißem Grund
KI-Sprachmodelle erfinden Falschaussagen, die plausibel klingen, statt Wissenslücken einzugestehen

Was sind KI Halluzinationen?

KI Halluzinationen sind selbstbewusst vorgetragene Falschaussagen eines Sprachmodells, die plausibel und flüssig klingen, aber keine Grundlage in den Fakten haben. Das Modell erfindet dabei Inhalte, statt eine Wissenslücke einzugestehen. Der Begriff ist metaphorisch gemeint, denn die Maschine nimmt nichts wahr, sondern berechnet wahrscheinliche Wortfolgen.

Werden KI Halluzinationen jemals ganz verschwinden?

Nach heutigem Forschungsstand nicht vollständig. OpenAI bezeichnet Halluzinationen als reduzierbar, aber nicht eliminierbar. Der Grund ist strukturell, denn die Genauigkeit erreicht nie hundert Prozent, weil manche Fragen schlicht unbeantwortbar sind. Die Rate sinkt aber von Generation zu Generation spürbar.

Warum halluziniert KI überhaupt?

Weil Sprachmodelle Wahrscheinlichkeiten für Wortfolgen schätzen und kein Wissen im menschlichen Sinn besitzen. Fehlt eine Information, füllt das Modell die Lücke mit dem statistisch Wahrscheinlichsten. Zusätzlich belohnen viele Trainings- und Bewertungsverfahren das Raten und bestrafen ehrliche Unsicherheit.

Halluzinieren neuere Modelle weniger als ältere?

In der Tendenz ja, aber nicht bei jeder Aufgabe. OpenAI nennt für GPT-5 eine niedrigere Rate als für die Vorgänger. Beim quellentreuen Zusammenfassen schneiden Reasoning-Modelle laut Vectara-Leaderboard jedoch oft schlechter ab, weil sie über die Quelle hinausdenken.

Wie kann ich Halluzinationen im Unternehmen reduzieren?

Drei Hebel wirken zuverlässig: Retrieval-Augmented Generation bindet das Modell an geprüfte eigene Dokumente, präzise Prompts erlauben dem Modell ein ehrliches Ich weiß es nicht, und eine Prüfschicht aus einem zweiten Modell oder einem Fachmenschen fängt verbliebene Fehler ab. Bei kritischen Anwendungen bleibt die menschliche Endkontrolle Pflicht.

Wer haftet, wenn eine KI falsche Informationen liefert?

Nach einem Urteil des Oberlandesgerichts Hamm vom Mai 2026 haftet der Betreiber eines KI-Chatbots für dessen Inhalte, auch wenn er selbst keine fehlerhaften Daten eingespeist hat. Die Verantwortung lässt sich also nicht an den Modellhersteller weiterreichen.

Quellen

OpenAI | Warum Sprachmodelle halluzinieren | https://openai.com/de-DE/index/why-language-models-hallucinate/ | besucht am 22.06.2026

Fraunhofer IESE | Halluzinationen von generativer KI und großen Sprachmodellen (LLMs) | https://www.iese.fraunhofer.de/blog/halluzinationen-generative-ki-llm/ | besucht am 22.06.2026

IBM | Was sind KI-Halluzinationen? | https://www.ibm.com/de-de/think/topics/ai-hallucinations | besucht am 22.06.2026

Google Cloud | Was sind KI-Halluzinationen? | https://cloud.google.com/discover/what-are-ai-hallucinations?hl=de | besucht am 22.06.2026

Cloudflare | Was sind KI-Halluzinationen? | https://www.cloudflare.com/de-de/learning/ai/what-are-ai-hallucinations/ | besucht am 22.06.2026

Vectara | Hallucination Leaderboard (HHEM) | https://github.com/vectara/hallucination-leaderboard | besucht am 22.06.2026

Vectara | Introducing the Next Generation of Vectara’s Hallucination Leaderboard | https://www.vectara.com/blog/introducing-the-next-generation-of-vectaras-hallucination-leaderboard | besucht am 22.06.2026

Computer Weekly | Was ist KI-Halluzination? | https://www.computerweekly.com/de/definition/KI-Halluzination | besucht am 22.06.2026

]]>

4,2 10 Bewertungen

Wie hat Ihnen dieser Artikel gefallen?