ChatGPT lernt gerade Codebausteine von Stack Overflow auswendig (Symbolbild)
ChatGPT lernt gerade Codebausteine von Stack Overflow auswendig (Symbolbild)
Bildquelle: pvl0707, Lizenz

Stack Overflow will Nutzer-Inhalte vor ChatGPT-Training schützen

Bisher konnten Tech-Konzerne KI-Tools wie ChatGPT oder Copilot kostenlos mit Daten von Stack Overflow füttern. Doch das soll sich nun ändern.

Bisher konnten Entwickler von KI-Tools wie ChatGPT oder Copilot kostenlos Daten von Stack Overflow abgreifen, um ihre Algorithmen zu trainieren. Doch das soll sich in Kürze ändern. Bisher verstoßen die KI-Anbieter in den meisten Fällen gegen die Nutzungsbedingungen der Plattform. Eine finanzielle Entschädigung soll aber bald alles richten.

KI-Training vs. Urheberrechte

Erst vor wenigen Tagen legte Reddit vor. Nun will sich auch Stack Overflow ab Mitte dieses Jahres dafür entlohnen lassen, wenn Anbieter von KI-Tools wie ChatGPT ihre Algorithmen mit den auf dem Q&A-Portal für Softwareentwickler verfügbaren Daten trainieren.

Bisher griffen viele groß angelegte KI-Projekte noch völlig kostenlos auf im Internet frei zugängliche Trainingsdaten zurück. Jedoch kamen in den letzten Monaten immer wieder Zweifel an der Rechtmäßigkeit dieser Vorgehensweise auf. Denn auch wenn die Daten frei verfügbar sind, heißt das noch lange nicht, dass ihre Urheber der Verwendung für das KI-Training zugestimmt haben.

Ein neuer Trend zeigt aber, dass es auf Dauer nicht dabei bleibt. Plattformbetreiber fangen inzwischen an, sich für die massenhafte Verarbeitung ihrer Nutzerdaten bezahlen zu lassen. So auch Stack Overflow, das die 50 Millionen Fragen und Antworten seiner Benutzer mit einer Bezahlschranke vor dem Missbrauch durch KI-Tools wie ChatGPT schützen will.

Stack Overflow will eine Entschädigung für Training von ChatGPT & Co.

Der Einsatz künstlicher Intelligenz gilt gemeinhin als eine der größten Chancen der Technologie-Branche. Neben bekannten KI-Chatbots setzt beispielsweise auch der von Microsoft und GitHub entwickelte Copilot auf derartige Algorithmen. Sein Ziel ist es, Softwareentwickler bei ihrer Arbeit durch die Empfehlung von Codebausteinen zu unterstützen.

Damit das funktioniert, müssen die Unternehmen ihre KI aber mit etlichen Millionen an Datensätzen trainieren. Je mehr Daten das Training umfasst, desto besser sind die Vorschläge und Empfehlungen des jeweiligen Tools.

Wie Wired berichtet, sei es dem CEO von Stack Overflow, Prashanth Chandrasekar, zufolge jedoch wichtig, dass Anbieter von KI-Tools wie ChatGPT oder Copilot Community-Plattformen “für ihre Beiträge entschädigen”. Denn nur so seien Letztere in der Lage, weiterhin Nutzer anzuziehen und hochwertige Informationen bereitzustellen.

Tools wie ChatGPT verstoßen gegen Nutzungsbedingungen von Stack Overflow

Bisher verstoßen KI-Entwickler laut Chandrasekar in den allermeisten Fällen gegen die Nutzungsbedingungen seiner Plattform. Denn die nutzergenerierten Inhalte auf Stack Overflow fallen unter eine Creative-Commons-Lizenz. Demnach dürfe zwar jeder die Daten frei verwenden, jedoch müsse er dabei immer auch angeben, woher diese stammen.

Chandrasekar betont, Stack Overflow wolle lediglich von jenen Unternehmen eine Vergütung, die KI-Tools für große kommerzielle Zwecke entwickeln, wie dies bei ChatGPT oder Copilot der Fall ist. Der kostenlose Zugriff auf die Daten des Portals sei für die meisten Organisationen also weiterhin gewährleistet. Konkrete Preisinformationen wolle man erst in den kommenden Wochen veröffentlichen.

Schon zuvor standen Moderatoren der Entwickler-Plattform dem von OpenAI entwickelten KI-Chatbot kritisch gegenüber. Im Dezember 2022 sprachen sie ein Verbot aus, von ChatGPT generierte Antworten auf Stack Overflow zu posten. Denn die Flut an fehlerhaften Informationen, die daraus folge, lasse sich vom Moderatoren-Team kaum angemessen verarbeiten.

Über

Marc Stöckel hat nach seiner Ausbildung zum IT-Systemelektroniker und einem Studium im Bereich der technischen Informatik rund 5 Jahre als Softwareentwickler gearbeitet. Um seine technische Expertise sowie seine Sprachfertigkeiten weiter auszubauen, schreibt er seit dem Sommer 2022 regelmäßig Artikel zu den Themenbereichen Software, IT-Sicherheit, Datenschutz, Cyberkriminalität und Kryptowährungen.