KI-Jailbreak Semantic Chaining: Neue Technik unterläuft KI-Schutzmechanismen


Kommentare zu folgendem Beitrag: KI-Jailbreak Semantic Chaining: Neue Technik unterläuft KI-Schutzmechanismen

KI-Jailbreak Semantic Chaining knackte Grok 4 & Gemini Nano Banana Pro mit einem scheinbar unauffälligen linguistischen Bedeutungsmechanismus

interessant, das geht auch umgekehrt. wenn man ein strategiespiel spielt wo man eine fraktion, nation oder sonstiges spielt und sich mit der ki über das was man da so erlebt unterhält kann es passieren das dinge zensiert werden obwohl es keinen grund gibt. wenn man sich zum beispiel über die unfaire spielweise und assoztialem verhalten bei vberhandlungen auslässt und später dann sowas sagt wie „wenn die mich zu sehr nerven schicke ich mein millitär und vernichte sie einfach“ kann es passieren das dann eine ausgabe kommt die abgebrochen wird weil sie zensiert ist. das ist mir mal vor einiger zeit passiert.

daraus ergibt sich das ich eine reaktion erzeugt habe die alleine gestellt ziemlich assi ist da es um die vernichtung von menschen geht und das ist halt zensiert. der kontext ist aber das es virtuell ist, also nur ein spiel und er ergibt sich ja daraus das ich mich verteidige gegen aggressoren. diese punkte werden bei der zensur entsprechend ausgeblendet wie es aussieht.