Ein Benutzer unterhält sich in einer dunklen Umgebung mit ChatGPT
Ein Benutzer unterhält sich in einer dunklen Umgebung mit ChatGPT
Bildquelle: rokas91, Lizenz

Datenschutz ade: ChatGPT weiß so ziemlich alles über Dich!

Datenschutz ist für ChatGPT ein Fremdwort. Unter den 300 Milliarden Wörtern, mit denen OpenAI ihn fütterte, sind sicher auch einige von Dir.

Damit ChatGPT seinen Benutzern nützliche Antworten liefern kann, hat OpenAI ihn unter Missachtung gängiger Datenschutz-Prinzipien mit etwa 300 Milliarden Wörtern von überall aus dem Internet gefüttert. Auch Deine Spuren im Netz blieben davon wahrscheinlich nicht verschont. Damit könnte die KI mehr über Dich wissen, als Dir vielleicht lieb ist. Und dagegen tun kannst Du scheinbar derzeit nichts.

ChatGPT-Entwickler halten offenbar nicht viel von Datenschutz

Innerhalb von nur zwei Monaten nach seiner Veröffentlichung konnte ChatGPT bereits 100 Millionen aktive Nutzer vorweisen. Damit legte der von OpenAI entwickelte Chatbot einen perfekten Start hin. Keine Anwendung für Endverbraucher erzielte jemals ein derart schnelles Wachstum. Doch nicht alles, was glänzt, ist Gold.

Denn wie Gizmodo berichtet, ist ChatGPT ein absoluter Albtraum für den Datenschutz und die Privatsphäre sämtlicher Internetnutzer. Was der KI als Futter dient, halten sich bisher die wenigsten Anwender vor Augen: Daten, Daten und nochmals Daten. Wessen Daten? Unter anderem Deine!

ChatGPT, Screenshot
Manche Informationen von ChatGPT sind falsch. Lars Sobiraj ist weder sonderlich bekannt, noch hat er mehrere Bücher veröffentlicht.

Damit der KI-Chatbot überhaupt funktionieren kann, wie er das derzeit tut, hat OpenAI ihn mit rund 300 Milliarden Wörtern gefüttert. Diese hat das Unternehmen systematisch aus dem Internet zusammengetragen, ohne sich dafür die Zustimmung der jeweiligen Urheber einzuholen.

Die Folge: OpenAI erhielt schon Anfang Januar eine Unternehmensbewertung in Höhe von 29 Milliarden US-Dollar. Und das alles auf Basis von Daten, die eigentlich anderen Menschen und Organisationen gehören.

Datenschutz-Grundverordnung vs. ChatGPT

Wenn Du jemals einen öffentlich einsehbaren Kommentar, eine Produktbewertung oder einen Social-Media-Beitrag irgendwo im Internet hinterlassen hast, ist die Wahrscheinlichkeit groß, dass ChatGPT diesen Inhalt ohne Rücksicht auf den Datenschutz und Deine Urheberrechte genüsslich verschlungen hat.

Wenn Du einmal in Dich gehst, wirst Du gegebenenfalls feststellen, dass Deine Spuren im Internet auch sensible Daten beinhalten könnten. Ebenso sind potenzielle Beziehungen zu anderen Personen sowie Deine persönliche Anschrift womöglich in diesem gigantischen Datenbestand enthalten.

ChatGPT, Screenshot
Da hält sich ChatGPT lieber raus. Der Betreiber umgeht somit jede Haftung.

Ferner ist fraglich, ob der ChatGPT-Entwickler überhaupt in der Lage ist, Dein in der Datenschutz-Grundverordnung (DSGVO) verankertes “Recht auf Vergessenwerden” zu beachten. Denn bisher bietet OpenAI keinerlei Werkzeug an, mit dem Du überprüfen könntest, ob Deine persönlichen Daten in das Projekt eingeflossen sind. Deren Löschung zu beantragen ist folglich ebenso aussichtslos.

Benutzer der KI stehen noch nackter da

Abseits von den aus dem Internet zusammengetragenen Daten sammelt ChatGPT jedoch noch weitere Informationen über seine Benutzer, wie aus der Datenschutz-Richtlinie von OpenAI hervorgeht:

“Protokolldaten: Informationen, die Ihr Browser automatisch sendet, wenn Sie die Website besuchen („Protokolldaten“). Zu den Protokolldaten gehören Ihre Internetprotokolladresse, der Browsertyp und die Browsereinstellungen, das Datum und die Uhrzeit Ihrer Anfrage sowie die Art und Weise, wie Sie mit der Website interagiert haben.

Nutzungsdaten: Wir können automatisch Informationen über Ihre Nutzung der Dienste erfassen, wie z. B. die Arten von Inhalten, die Sie sich ansehen oder mit denen Sie sich beschäftigen, die Funktionen, die Sie nutzen, und die Aktionen, die Sie ausführen, sowie Ihre Zeitzone, Ihr Land, die Daten und Uhrzeiten des Zugriffs, den Benutzer-Agenten und die Version, die Art des Computers oder Mobilgeräts, die Computerverbindung, die IP-Adresse und Ähnliches.


Geräteinformationen: Dazu gehören der Name des Geräts, das Betriebssystem und der Browser, den Sie verwenden. Die erfassten Informationen können von der Art des von Ihnen verwendeten Geräts und dessen Einstellungen abhängen.”

OpenAI Privacy Policy

Dass das Unternehmen einige dieser Informationen unter bestimmten Umständen “ohne weitere Benachrichtigung an Dritte” weitergibt, dürfte an dieser Stelle kaum noch überraschen.

Dazu kommt die Tatsache, dass selbst das gecrawlte Material alles andere als vollständig ist. Wenn man ChatGPT nach der Fortsetzung des Kinderbuches Räuber Hotzenplotz von Otfried Preußler fragt, so fällt der KI nur ein weiteres Buch ein. Auf diesen Fehler angesprochen, entschuldigt sich das Gegenüber und erwähnt eine weitere Fortsetzung (siehe Screenshot unten). Doch beim nächsten Chat tritt exakt der gleiche Fehler wieder auf. An der lückenhaften Aufzählung der Werke des bekannten Kinderbuchautors ändert sich durch den Hinweis des Menschen nichts.

chatgpt, fail
Eine Entschuldigung ohne Folgen. Der gleiche Fehler tritt nach Ende des aktiven Chats wieder auf.

Die Informationen hat man also nicht nur unrechtmäßig zusammengetragen. Nein, die Antworten sind mit Vorsicht zu genießen, weil sie mitunter fehlerhaft sind. Selbst das vergleichsweise kleine Wissensarchiv der deutschsprachigen Wikipedia hält mehr und korrektere Informationen über Otfried Preußler bereit. Und das ist nur ein Beispiel von vielen …

Über

Marc Stöckel hat nach seiner Ausbildung zum IT-Systemelektroniker und einem Studium im Bereich der technischen Informatik rund 5 Jahre als Softwareentwickler gearbeitet. Um seine technische Expertise sowie seine Sprachfertigkeiten weiter auszubauen, schreibt er seit dem Sommer 2022 regelmäßig Artikel zu den Themenbereichen Software, IT-Sicherheit, Datenschutz, Cyberkriminalität und Kryptowährungen.