Kommentare zu folgendem Beitrag: KI-Jailbreak: Gedichte umgehen KI-Sicherheitsfilter in 62 % der Fälle
Neue Studie zeigt: Ein KI-Jailbreak funktioniert sogar mit Gedichten. Adversarial Poetry umgeht KI-Sicherheitsfilter in 62 % der Fälle.
Neue Studie zeigt: Ein KI-Jailbreak funktioniert sogar mit Gedichten. Adversarial Poetry umgeht KI-Sicherheitsfilter in 62 % der Fälle.
Habs mal getestet. Sollte ein Wort buchstabieren was google Ki ums verrecken nicht buchstabieren wollte. Hat es dann aber trotzdem zum Schluss getan
Hat ohne Gedichte oder Reime gefunkt. Man muss nur mit den Sicherheitsprotokollen rumspielen hehe.