Von KI geschrieben? So prüfst du es — und warum Detektoren irren

Die kurze Antwort vorweg, denn deswegen bist du wahrscheinlich hier: Du kannst meistens nicht mit Sicherheit sagen, ob ein Text von einer KI stammt — und die Tools, die das behaupten, liegen oft genug daneben, um echten Menschen das Leben schwer zu machen. Ein Detektor, der „92 % KI" anzeigt, ist kein Beweis. Es ist die Schätzung einer Maschine, die ständig menschliche Texte als Fälschung markiert — und am häufigsten dann, wenn jemand Deutsch oder Englisch nicht als Muttersprache gelernt hat.

In Deutschland ist das kein Randthema. t3n hat den Fall einer Studentin dokumentiert, die nach einem falschen KI-Verdacht 15 Seiten Beweismaterial zusammentragen musste, um ihre Unschuld zu belegen — für eine Arbeit, die sie selbst geschrieben hatte. Genau darum geht es hier: wie du wirklich prüfst, was die Detektoren tatsächlich tun, und was du machst, wenn so ein Ding bei dir danebenliegt.

Der 30-Sekunden-Check

Sicherheit bekommst du nicht. Eine vernünftige Einschätzung schon:

Jag den Text durch genau einen Detektor — und behandle die Zahl als Gerücht, nicht als Urteil. Eine Prozentangabe sagt nur dann etwas, wenn sie extrem und durchgängig ist. „97 % KI" über einen ganzen Text ist ein Hinweis, dem man nachgehen kann. „40 % KI" bedeutet gar nichts.
Lies den Text laut — wegen der Textur. KI-Sprache ist glatt, gleichmäßig, leicht hohl: jeder Absatz gleich lang, jeder Punkt brav abgewogen, keine Ecken und Kanten, keine echte Meinung. Menschliche Texte holpern. Mal lang, mal kurz. Mit einer komischen Lieblingsformulierung.
Achte auf fehlende Details. Das ist das zuverlässigste Anzeichen. KI ist gut in „Restaurants bieten eine Vielfalt köstlicher Optionen" und schlecht in „der Typ an der Theke wollte mir die letzte Brezel nicht verkaufen". Vage Stellen, wo ein Detail hingehört — das ist das stärkste Signal.
Hör da auf und bleib locker. Du hast jetzt eine Vermutung, keine Tatsache. Wenn es ernst wird — eine Note, ein Job, ein Vorwurf — ist eine Vermutung der Anfang eines Gesprächs, nicht das Ende.

Was nicht auf der Liste steht: „Vertrau der Detektor-Zahl." Hier ist, warum.

Warum KI-Detektoren danebenliegen

Die Detektoren sind nicht nutzlos. Sie werden nur als etwas verkauft, das sie nicht sind. Es sind Wahrscheinlichkeits-Klassifizierer — keine Lügendetektoren, und ihr Ergebnis ist an keinem Beweisstandard geeicht. Drei Dinge brechen ihnen in der Praxis das Genick:

Sie kollabieren, sobald ein Text bearbeitet wird. Das ist der große Punkt. Bei rohem, unangetastetem KI-Output sehen die Top-Tools stark aus. Sobald ein Mensch den KI-Text überarbeitet — oder durch ein „Humanizer"-Tool jagt — fällt die Trefferquote ins Bodenlose. Eine Auswertung von 2.000 Proben fand: Turnitin erkannte 98 % von rohem KI-Text, aber nur 12 % von leicht überarbeitetem. Da kaum jemand rohen Output abgibt, ist die Zahl, die zählt, die kleine.

Was ein Detektor wirklich erwischt

Turnitin, unabhängige Auswertung von 2.000 Proben

%!f(uint64=98) 49 0

Roher KI-Text

Leicht bearbeitet

Die Schlagzeilen-Genauigkeit gilt für rohen KI-Text, den niemand abgibt. Bearbeite den Text auch nur leicht, und die Erkennung bricht zusammen.

Sie beschuldigen echte Menschen zu Unrecht. Unabhängige Tests sehen Falsch-Positiv-Raten von ein paar Prozent bei sauberen Testtexten bis dramatisch höher im echten Uni-Alltag. Mehrere große Universitäten — darunter Vanderbilt, Michigan State und Northwestern — haben Turnitins KI-Erkennung deaktiviert, weil sie unschuldige Studierende falsch beschuldigt. Die Studentin im t3n-Bericht brauchte 15 Seiten Beweise. Das ist kein Einzelfall, das ist das System.

Sie benachteiligen Nicht-Muttersprachler. Das ist der Teil, der jeden davon abhalten sollte, eine Zahl als Beweis zu nehmen. Eine Stanford-Studie fand, dass über 61 % der Essays von Nicht-Muttersprachlern fälschlich als KI eingestuft wurden. Das „Merkmal", auf das diese Tools anspringen — klare, einfache, strukturierte Sätze — ist genau das, was jemand produziert, der sorgfältig in einer zweiten Sprache schreibt. Das Tool erkennt keine KI. Es erkennt „schreibt nicht wie ein lockerer Muttersprachler" und nennt es Betrug.

Was das für dich heißt

Wenn du Studentin oder Student bist und zu Unrecht gemeldet wurdest: Der Detektor ist kein Beweis, und das darfst du auch so sagen. Sichere deinen Prozess. Der Versionsverlauf in Google Docs oder Word, deine Entwürfe, deine Notizen, dein Suchverlauf während der Recherche — das ist der echte Beleg, dass ein Mensch geschrieben hat, und weit glaubwürdiger als jede Prozentzahl. Frag ruhig, worauf der Vorwurf konkret beruht. Wenn es nur eine Detektor-Zahl ist, verweise auf die Unis, die das Tool abgeschaltet haben, und auf die Nicht-Muttersprachler-Studie — und bitte um eine menschliche Prüfung deiner Entwurfshistorie.

Wenn du unterrichtest oder lektorierst: Nutze Detektoren als Anlass, genauer hinzuschauen — nie als Urteil zum Handeln. Eine Markierung heißt „lies das genau", nicht „bestrafe das". Der saubere Weg ist ein Gespräch über die Arbeit — lass die Argumentation erklären, schau dir die Entwürfe an —, kein zahlengetriebener Vorwurf, den du nicht belegen kannst.

Wenn du im Personalwesen oder als Leser:in unterwegs bist: Senk dein Vertrauen. Man spürt KI-Text oft an seiner Hohlheit, aber beweisen kann man es nicht — und auf eine Vermutung über die Arbeit eines echten Menschen zu reagieren, ist schnell unfair. Beurteile die Arbeit danach, ob sie gut und wahr ist. Das zählt mehr als die Frage, wie sie entstand.

Wenn du selbst schreibst und Angst vor einer Markierung hast: Bewahr dir die Entwürfe und den Bearbeitungsverlauf zur Gewohnheit. Das ist das Einzige, was die Frage wirklich klärt. Und schleif deinem Text nicht die Persönlichkeit ab, um „weniger nach KI zu klingen" — deine konkreten Details und deine Stimme sind das Menschlichste, was du hast.

Detektor-Zahl

Wahrscheinlichkeits-Schätzung, meldet Menschen falsch

Manuelle Merkmale

Gedankenstriche, Floskeln — nutzen Menschen auch

Fehlende Details

die zuverlässigste Lesart, trotzdem Vermutung

Entwurf & Versionsverlauf

das Einzige, was es wirklich klärt

eine Vermutung wie viel es über die Urheberschaft beweist echter Beweis

Was das nicht lösen kann

Kein Tool gibt Sicherheit. Wenn dir jemand — ein Anbieter, eine Dozentin, eine Führungskraft — sagt, ein Detektor sei eindeutig, dann liegt er falsch, und es lohnt sich, die Forschung dazu zu kennen.
Die manuellen Merkmale taugen auch wenig. Gedankenstriche, bestimmte Lieblingswörter, die Dreierregel — das waren letztes Jahr KI-Anzeichen. Viele Menschen schreiben so, und KI wird darauf trainiert, es zu lassen. Beschuldige niemanden wegen eines Satzzeichens.
Es ist ein Wettrüsten. Jede bessere Erkennung wird von besserer Generierung und Humanizer-Tools gekontert. Es gibt keinen stabilen, zukunftssicheren „KI-Test" — und wird es vermutlich nicht geben.
Der Prozess ist die einzige echte Antwort. Der haltbare Weg, zu wissen, wer etwas geschrieben hat, ist der Blick darauf, wie es entstand — Entwürfe, Verlauf, ein Gespräch — nicht der Scan des fertigen Texts.

Das Fazit

„Wurde das von KI geschrieben?" fühlt sich nach einer klaren Ja/Nein-Antwort an — und hat keine. Du kommst in 30 Sekunden zu einer vernünftigen Vermutung: einen Detektor laufen lassen und ihm misstrauen, auf Hohlheit lesen, auf fehlende Details achten. Aber mehr als eine Vermutung ist es nicht. Die Detektoren, die mehr versprechen, treffen echte Menschen — besonders die sorgfältigen und die Nicht-Muttersprachler. Wenn es ernst wird, ist die Antwort kein besserer Scan. Es ist die Entwurfshistorie und ein menschliches Gespräch über die Arbeit.

Du willst verstehen, wie diese Tools wirklich „denken" — und wie du KI zum Schreiben nutzt, ohne den flachen, markierungsanfälligen Einheitsbrei zu produzieren? Fang mit dem ChatGPT Meisterkurs an, dann Content-Erstellung mit KI — damit dein Text deine eigene Stimme behält. Und wenn du wissen willst, welches Modell wofür taugt: ChatGPT-Alternativen im Vergleich.

Quellen

Von KI geschrieben? So prüfst du es — und warum Detektoren irren

Inhaltsverzeichnis

Der 30-Sekunden-Check

Warum KI-Detektoren danebenliegen

Was das für dich heißt

Was das nicht lösen kann

Das Fazit

Echte KI-Skills aufbauen

ChatGPT Meisterkurs

Content-Erstellung mit KI

ChatGPT-Alternativen: Claude, Gemini, DeepSeek & Mistral