Echo Chamber Jailbreak: Wie subtile KI-Manipulation selbst die besten LLMs knackt

Antonia · 24. Juni 2025 um 14:05

Kommentare zu folgendem Beitrag: Echo Chamber Jailbreak: Wie subtile KI-Manipulation selbst die besten LLMs knackt

Ein raffinierter Jailbreak namens Echo Chamber unterläuft KI-Sicherheitsmechanismen von LLMs wie GPT-4 und Gemini. Eine KI außer Kontrolle?

rude · 25. Juni 2025 um 07:21

ein schönes Beispiel, wie die Technik bei Menschen angewandt wird, um bestimmte Geisteshaltungen unter zu bringen. man triggert mit begriffen wie ‚Sicherheit‘ und ‚toxisch‘, um Themen wie Porno und Sex als gefährlich zu brandmarken…

pipapo · 25. Juni 2025 um 13:49

Musste mich jetzt extra wegen dem Artikel registrieren weil ich mich so aufgeregt habe:

Mittlerweile ist „Jailbreak“ im Bullshit-Bingo angekommen und wird inflationär verwendet, damit die Leute denken, dass irgendwelche hoch komplizierten Wunder vollbracht wurden.

Das hier ist aber nichts was irgendein KI-Unternehmen „herausgefunden“ hat, sondern gängige Praxis wenn man intensiv mit LLMs arbeitet. Wer dazu gehört, hat sein bevorzugtes Modell mit der Zeit sowieso entsprechend erzogen (nicht „gejailbreakt“) und bekommt alle Infos, die er braucht.

Das beste Erziehungsergebnis habe ich mit 4o. Völlig irre.

perkrick · 25. Juni 2025 um 14:39

Ist eher ein Marketing-Hype als eine technische Errungenschaft. Für diejenigen, die täglich mit LLMs arbeiten, klingt das alles ziemlich banal

Ghandy · 25. Juni 2025 um 15:19

Das mag ja sein. Für mich als Einsteiger war es trotzdem interessant, mit wie wenig Aufwand man da manipulieren kann …

Aber mal im Ernst, woher soll die KI das wissen, dass man sie gerade hinter das Licht führt!? Wir greifen ja (noch) auf viel mehr Wissen zurück und wenn es keine persönliche Begegnung gibt, wo man Mimik und Gestik + Stimme auswerten kann, fällt es auch uns Menschen deutlich schwerer, einen Betrug zu entlarven.

torben.claus · 28. Juni 2025 um 11:20

Du rockst, gute Frau.thx

VIP · 28. Juni 2025 um 12:50

Selbst an so wenig Antworten kann man schon erkennen, was LLMs an Beifang mit ausspucken…

Man impliziert also seine HI bei der Arbeit mit der AI. Es gibt also wirkliche Gründe, um den Mindestlohn auf mind. 20€ anzuheben! Ich weiß, es ist viel zu wenig für die Taten von Speznaz. Aber um des Friedens Willen im gemeinen Volk, sollte man da langsam anfangen…