Ein Roboter unterzeichnet ein Dokument
Ein Roboter unterzeichnet ein Dokument
Bildquelle: AndreyPopov, Lizenz

Bücher für KI-Training: Meta räumt Verwendung von „raubkopierten“ Inhalten ein

Meta hat zugegeben, Teile des umstrittenen Books3-Datensatzes für das KI-Training seiner Llama-Modelle verwendet zu haben.

Die rasante Entwicklung von KI-Initiativen hat nicht nur Innovationen gefördert, sondern auch eine Lawine von Urheberrechtsproblemen ausgelöst. Meta steht nun im Rampenlicht, nachdem der Technologiegigant zugegeben hat, Teile des Books3-Datensatzes für das KI-Training seiner Llama-Modelle verwendet zu haben. Ein Datensatz, der „raubkopierte“ Bücher enthält.

In diesem Blogbeitrag werfen wir einen Blick auf die Hintergründe und die laufenden Gerichtsverfahren. Aber auch die möglichen Auswirkungen auf die Entwicklung von KI werden wir uns genauer anschauen.

Der Boom der künstlichen Intelligenz und die Klagewelle der Rechteinhaber

Der KI-Boom hat eine Flut von Klagen von Rechteinhabern ausgelöst. Darunter Autoren, Plattenfirmen, bildende Künstler und sogar die New York Times. Ihr Vorwurf: Die Nutzung ihrer Werke ohne angemessene Vergütung durch Technologieunternehmen, die ihre KI trainieren.

Der umstrittene Datensatz „Books3“, der von dem KI-Forscher Shawn Presser im Jahr 2020 erstellt wurde, sollte ursprünglich KI-Enthusiasten beim KI-Training helfen. Die Sammlung von mehr als 195.000 Büchern wurde jedoch auch von großen Technologieunternehmen genutzt. Dies blieb auch für die Verlage nicht unbemerkt.

Die zunehmende Verbreitung von KI hat die Aufmerksamkeit der Rechteinhaber auf sich gezogen. Die dänische Anti-Piraterie-Gruppe Rights Alliance forderte bereits die Entfernung von Books3-Kopien.

Bücher für KI-Training: Meta räumt teilweise Nutzung von Books3 ein

Inmitten dieser Kontroverse hat Meta vor einem kalifornischen Bundesgericht zugegeben, „Teile von Books3“ für das Training seines KI-Modells Llama verwendet zu haben. Dieses Eingeständnis wirft die Frage auf, ob Meta in diesem Fall nicht im Unrecht war. Dies berichtet TorrentFreak in einem aktuellen Artikel.

Meta gibt zu, die Bücher für KI-Training genutzt zu haben
Meta gibt zu, die Bücher für KI-Training genutzt zu haben

In seiner Klageerwiderung bestreitet Meta allerdings die Urheberrechtsverletzung. Der Konzern betont, dass für die Nutzung von Books3 keine ausdrückliche Zustimmung, Anerkennung oder Vergütung erforderlich sei. Das Unternehmen beruft sich auf das Konzept der fairen Verwendung, das nach Ansicht von Meta auch für unerlaubte Kopien der urheberrechtlich geschützten Werke der Kläger gilt.

Von gut gemeinten Archivierungsbemühungen zum juristischen Schlachtfeld

Während KI-Unternehmen darauf beharren, dass strenge Regeln den Fortschritt behindern könnten, sehen sie sich mit einem komplexen Urheberrechtsstreit konfrontiert. Die Rolle der fairen Nutzung von Büchern für KI-Training wird nicht nur für „Piratenquellen“, sondern auch für die Verwendung von Inhalten über offizielle Kanäle von entscheidender Bedeutung sein.

Der Datensatz Books3 , der ursprünglich als Beitrag zur Innovation gedacht war, ist nun Teil einer weitreichenden Copyrechts-Klage. Die Zukunft der KI könnte stark vom Ausgang dieser Rechtsstreitigkeiten beeinflusst werden. Der Wandel von gut gemeinten Archivierungsbemühungen hin zu einem juristischen Schlachtfeld zeigt, dass die Entwicklung der künstlichen Intelligenz auch rechtliche Herausforderungen mit sich bringt, die noch eingehender untersucht werden müssen.

Tarnkappe.info

(*) Alle mit einem Stern gekennzeichneten Links sind Affiliate-Links. Wenn Du über diese Links Produkte oder Abonnements kaufst, erhält Tarnkappe.info eine kleine Provision. Dir entstehen keine zusätzlichen Kosten. Wenn Du die Redaktion anderweitig finanziell unterstützen möchtest, schau doch mal auf unserer Spendenseite oder in unserem Online-Shop vorbei.

Über

Sunny schreibt seit 2019 für die Tarnkappe. Er verfasst die wöchentlichen Lesetipps und berichtet am liebsten über Themen wie Datenschutz, Hacking und Netzpolitik. Aber auch in unserer monatlichen Glosse, in Interviews und in „Unter dem Radar“ - dem Podcast von Tarnkappe.info - ist er regelmäßig zu hören.