KI-Jailbreak: Gedichte umgehen KI-Sicherheitsfilter in 62 % der Fälle

Antonia · 23. November 2025 um 13:24

Kommentare zu folgendem Beitrag: KI-Jailbreak: Gedichte umgehen KI-Sicherheitsfilter in 62 % der Fälle

Neue Studie zeigt: Ein KI-Jailbreak funktioniert sogar mit Gedichten. Adversarial Poetry umgeht KI-Sicherheitsfilter in 62 % der Fälle.

gruber39 · 29. November 2025 um 19:29

Habs mal getestet. Sollte ein Wort buchstabieren was google Ki ums verrecken nicht buchstabieren wollte. Hat es dann aber trotzdem zum Schluss getan Hat ohne Gedichte oder Reime gefunkt. Man muss nur mit den Sicherheitsprotokollen rumspielen hehe.