KI-Detektoren werden immer häufiger genutzt, um KI-generierte Texte herauszufiltern oder entsprechenden zu labeln. Dies führt dazu, dass immer mehr Content-Ersteller, Blog-Writer und Studenten auf der Suche nach Tools zur Umgehung der KI-Erkennung sind. Da stellt sich die Frage können diese sogenannten Bypasser wirklich KI-Textdetektoren umgehen oder ist das oft nur rausgeschmissenes Geld? In diesem Blogartikel gehen wir dieser Frage auf den Grund und betrachten auch die damit einhergehenden ethischen Fragen.
Das sind Tools die dazu gedacht sind KI-generierte Inhalte so zu verändern, dass Sie von KI-Detektoren als menschliche Inhalte wahrgenommen werden. Zum jetzigen Zeitpunkt handelt es sich bei den Inhalten überwiegend um Texte. Diese Tools formulieren Texte um und verändern die grundlegende Struktur, um so mehr Variation in dem Schreibstil und der Wortwahl zu bekommen. Das Ziel ist es, die typische Signatur von generieren KI-Modellen wie ChatGPT aus dem Text zu entfernen.
Diese zentralen Gründe erklären, warum solche Tools immer gefragter werden:
In Bereichen wie Universitäten oder Verlagen werden KI-Texte oft verboten, da Sie deren Standards nicht entsprechen oder den Sinn der Aufgabe verfehlen. Studenten und Autoren versuchen diese Richtlinien durch Bypasser zu umgehen.
Viele Leser nehmen KI-generierte Texte immer noch als weniger glaubwürdig wahr. Sie hinterfragen die Inhalte solcher Texte kritischer. Deswegen versuchen Autoren die KI-Urheberschaft zu verschleiern, um so den Leser zu täuschen. Zudem ist es für viele Marken und Content-Ersteller unerlässlich einen persönlichen und nahbaren Eindruck zu erwecken. Dies geht mit als menschliche wahrgenommen Texten eben leichter.
Jedem ist klar, dass Texte nun in sekundenschnelle von künstlichen Intelligenzen erzeugt werden können. Es ist so leicht, man gibt einen halbwegs durchdachten Prompt in ChatGPT ein. Zack ist der 4 seitenlange Blogbeitrag fertig. Nun noch schnell den Text in einen Bypasser schmeißen, damit der Text auch bloß nicht als hingeklatscht wahrgenommen wird. Allerdings wird dadurch nicht das Hauptproblem solcher Texte adressiert. Die Richtigkeit der Informationen. Es bleibt unerlässlich nochmal zu überprüfen, ob diese stimmt und auch richtig rübergebracht wird.
Bypasser haben das Ziel die KI-typische Sigantur aus den Texten zu entfernen. Diese entsteht dadurch, dass KI-Modelle wie ChatGPT mit Wahrscheinlichkeitsverteilungen arbeiten, um logische Texte zu erstellen. KI-Detektoren ermitteln diese Verteilung anhand der Perplexität und Burstiness. Grob beschreiben beide Metriken wie wahrscheinlich die Wörter an Ihren Positionen sind und wie stark diese Verteilung über den Text hinweg sich verändert. Bypasser versuchen unwahrscheinlichere Wörter an den Positionen zu benutzen, um mehr Variation im Text zu erstellen. Dafür benutzen Sie in der Regel folgende Techniken:
Die Texte werden dadurch verändert, dass Synonyme ausgetauscht werden, Sätze in anderen Reihenfolgen wiedergegeben werden oder Aktiv-Sätze in Passiv-Sätze formuliert werden. Häufig wird auch die sogenannte Rückübersetzung genutzt. Bei dieser wird ein Text durch ein Übersetzungstool in eine andere Sprache übersetzt und dann wieder zurück in die Ausgangssprache. Die große Schwierigkeit bei dieser Methode ist die Logik des Satzes zu behalten.
Einige Bypasser zielen explizit darauf ab, bestimmte Strukturen im Text zu verändern, da diese als KI-generiert wahrgenommen werden. Es werden beispielsweise die Länge der Sätze angepasst, die Zeichensetzung oder auch Rechtschreibfehler eingebaut.
Es wird angenommen, dass monotone und formelle Sprache eher als KI-generierte klassifiziert wird. Deswegen arbeiten einige Anti-Erkennungstools auch mit dem allgemein Schreibstil. Sie nutzen umgangssprachliche Formulierungen oder andere eher ungewöhnliche Sprachstyle.
Damit ein KI-generierter Text „menschlicher“ wirkt und nicht mehr von Detektoren erkannt wird, müssen Tools sowohl die semantische (Bedeutung) als auch die syntaktische (Struktur) Ebene eines Textes verändern. Genau darin liegt die größte Herausforderung: Die ursprüngliche Logik und inhaltliche Korrektheit sollen erhalten bleiben, während die Satzstrukturen und Formulierungen stark angepasst werden.