KI-Texte erkennen
KI kommt fast überall zum Einsatz und noch üben sich die Nutzenden darin, KI möglichst präzise zu bedienen. Daher können KI-generierte Texte aktuell auch noch gut erkannt werden.
Wasserzeichen
Teilweise schützt KI die Antworten auf einen Prompt mit einem Wasserzeichen. Es ist für die Nutzenden nicht sichtbar, kann aber im Nachhinein ausgelesen werden. So könnten KI-generierte Texte leichter erkannt werden. Dieses Wasserzeichen wird allerdings gerade erst entwickelt, um beispielsweise mit Gemini generierte Texte zu erkennen. Ob es auch von anderen Anbietern übernommen wird, ist offen.
Ähnliche Versuche gab es bereits 2023, als Wasserzeichen Bilder fälschungssicher machen sollten. »Die Forschenden zeigen auf, wie vergleichsweise leicht sich Wasserzeichen aus KI-generierten Bildern ›auswaschen‹ lassen. Genauso einfach sei es, Wasserzeichen in menschlich generierte Bilder einzufügen und sie somit als vermeintliche Fake-Inhalte zu kennzeichnen.« (Quelle: netzpolitik.org)
Sprache
KI generierte Texte weisen eine geringere syntaktische und lexikalische Vielfalt auf. Sie arbeiten häufiger mit Wortwiederholungen, nutzen die immergleichen Redewendungen oder Wortgruppen. Der Text wirkt meist zielloser als menschlich generierte Texte. KI-Texte neigen zu Übertreibungen. Sie enthalten beispielsweise übermäßig häufig Wörter wie essenziell oder allgegenwärtig.
Kohärenz
Während wir zu Coronazeiten 2020 lernen mussten, was exponentielles Wachstum bedeutet, sollten wir uns nun mit der Bedeutung des Wortes Wahrscheinlichkeit beschäftigen. Das sogenannte Denken von KI beschränkt sich nämlich auf die Berechnung von Wahrscheinlichkeiten. Wie wahrscheinlich ist das nächste Wort? Wie wahrscheinlich ist die nächste Frage? KI redet uns quasi nach dem Mund, indem es die Wahrscheinlichkeit dafür berechnet, was wir hören wollen (Token Propability).
Letztlich gilt aber: Wenn KI mit den entsprechenden Prompts so gefüttert wird, dass zum Beispiel ein bestimmter Stil kopiert wird, argumentative Füllwörter präzise verwendet oder Genderschreibweisen benutzt werden, dann wird es nahezu unmöglich, herauszufinden, ob ein Text KI-generiert wurde oder KI-inspiriert entstanden ist.
Tools zur Prüfung
Die gesetzlich vorgeschriebene Kennzeichnungspflicht für KI-generierte Texte, Bilder oder Videos kommt ab August 2026. Für Anbieter und Betreiber, die KI-Inhalte nutzen, ohne sie kenntlich zu machen, drohen hohe Geldstrafen (Quelle: Gesellschaft für Datenschutz). Daher gibt es mittlerweile Unternehmen, die das Erkennen von KI-Inhalten erleichtern sollen.
GPT-Radar
Zur Analyse wird OpenAI GPT-3 genutzt. Es wird ein Perplexity Score zwischen 0 und 100 berechnet. Je geringer der Score, desto eher wurde der Text von KI geschrieben. Bis zu fünf Punkte bedeutet, dass es eine KI geschrieben hat.
»Perplexity is a measure of how well a language model is able to predict a word based on the words that came before it. It’s like a guessing game: the model looks at the words that have been said so far, and tries to guess what the next word will be.« (Quelle: GPT-Radar)
Detectora
Es ist eine Erkennungstool, das sich auf deutschsprachige Texte spezialisiert hat. Es testet bis zu 100 Texte (bis zu 1.000 Zeichen) kostenlos. In der Bezahlversion kostet es etwa 12 Euro im Monat, um 40.000 Wörter kontrollieren zu lassen.
»Unser KI-Detektor wurde ausschließlich auf deutschen Texten trainiert und berücksichtigt dabei die spezifischen Merkmale und Eigenheiten der deutschen Sprache. Damit setzen wir den Standard in der Erkennung von deutschen KI-Texten.« (Quelle: detectora)
