KI-Jailbreak: Gedichte umgehen KI-Sicherheitsfilter in 62 % der Fälle


Kommentare zu folgendem Beitrag: KI-Jailbreak: Gedichte umgehen KI-Sicherheitsfilter in 62 % der Fälle

Neue Studie zeigt: Ein KI-Jailbreak funktioniert sogar mit Gedichten. Adversarial Poetry umgeht KI-Sicherheitsfilter in 62 % der Fälle.

Habs mal getestet. Sollte ein Wort buchstabieren was google Ki ums verrecken nicht buchstabieren wollte. Hat es dann aber trotzdem zum Schluss getan :smiley: Hat ohne Gedichte oder Reime gefunkt. Man muss nur mit den Sicherheitsprotokollen rumspielen hehe.