Penguin Random House schließt KI-Textverwertung ihrer Werke aus

Penguin Random House schließt KI-Textverwertung aus

20.10.2024 von Antonia Frank Lesezeit: 3 Min.

Zugunsten von Urheberschutz passte Penguin Random House seinen Copyright-Wortlaut an. Der Verlag untersagt darin eine Textverwertung durch KI

Der Verlagsriese Penguin Random House (PRH) fügt auf den Copyright-Seiten seiner Bücher eine Klausel hinzu, die die Verwendung dieser Titel zum Trainieren künstlicher Intelligenz (KI) verbietet. Mit dieser Maßnahme will der Verlag das „geistige Eigentum der Autoren vor der Verwendung zum Trainieren großer Sprachmodelle (LLMs) und anderer Tools für künstliche Intelligenz (KI) schützen“.

Penguin Random House-Werke keine Quelle für KI-Training

Wie The Bookseller exklusiv berichtete, versieht Penguin Random House neue Bücher und Nachdrucke von Backlist-Titeln des Verlags künftig mit dem Hinweis:

„Kein Teil dieses Buches darf zum Trainieren von Technologien oder Systemen künstlicher Intelligenz in irgendeiner Weise verwendet oder reproduziert werden.“

Klausel bietet neuen Ansatz zum Schutz von Autoren

Zudem weist man in der Klausel darauf hin, dass Penguin Random House ihre Werke „ausdrücklich von Text- und Data-Mining ausnimmt“. Damit will der Verlag seine Autoren vor unerlaubtem Data-Mining schützen. Dieser Änderungsantrag steht im Einklang mit einer kürzlich erlassenen Richtlinie des Europäischen Parlaments. Darin geregelt sind Ausnahmen und Eigentumsrechte im Zusammenhang mit Text- und Data-Mining.

Unter Text- und Data-Mining versteht man das Durchsuchen großer Datenmengen wie etwa Bücher, um nützliche Informationen zu extrahieren. Gemäß The Bookseller ist Penguin Random House offenbar der erste große Verlag, der die KI-Klausel auf seiner Copyright-Site angibt.

Branche uneinig über KI-Einsatz

Damit grenzt sich Penguin Random House auch von anderen großen Verlagen ab. Erst im August wies der Verlag in einer Erklärung darauf hin, „das geistige Eigentum unserer Autoren und Künstler energisch zu verteidigen“. Laut Gizmodo haben Wissenschaftsverlage Taylor & Francis, Wiley und Oxford University Press zugestimmt, ihre Portfolios an KI-Unternehmen zu lizenzieren.

Allerdings schickte auch die New York Times Anfang letzter Woche eine Unterlassungsaufforderung an das KI-Start-up Perplexity. Sie forderten darin dazu auf, ihre Artikel nicht mehr als Grundlage zur Generierung von Antworten für ihr Modell zu verwenden.

Gemäß einem Artikel von 24books.de vom Februar wären bereits Titel von Penguin Random House am häufigsten in bestehender KI-Software vertreten. Eine Suche in der Books3 Datenbank, die als Grundlage für Metas LLaMA und ChatGPT von OpenAI dient, gab dabei darüber Aufschluss, welche Verlage diese Rangliste anführen.

Peter Schoppert, Geschäftsführer von NUS Press, durchforstete im Rahmen einer Analyse rund 72.000 vornehmlich englischsprachige E-Books. Die Durchsuchung erfolgte nach Autorenname, Verlagsname und ISBN. Als Ergebnis erhielt er dann den Verlag mit der größten Anzahl an E-Book-Titeln. Die Liste führte demnach Penguin Publishing Group an, mit 6.866 Werken, gefolgt von Harper Collins mit rund 5.800 Titeln. Auf Platz 3 landete Random House Publishing mit rund 3.400 E-Books.

Laptop mit fliegenden Bitcoin-Symbolen und einer Hand auf der Tastatur als Symbolbild für KI-gestützte Wallet-Recovery und verlorene Kryptowährungen.

Claude AI rettet Bitcoin: KI öffnet verlorenes 400.000-Dollar-Wallet

Claude AI rettet Bitcoin: Eine KI hilft dabei, ein verlorenes Wallet mit fünf Bitcoin nach elf Jahren wiederherzustellen.

Piratenbücher im Hörsaal: RettighedsAlliancen setzt auf Klagen statt nur auf Aufklärung.

Lehrbuch-Piraterie in Dänemark: Studenten riskieren Klagen und Geldstrafen

Lehrbuch-Piraterie in Dänemark: Ab Februar 2026 drohen Studierenden Klagen und Geldstrafen, wenn sie digitale Lehrbücher illegal teilen.

Netzsperren außer Kontrolle – Kollateralschäden im Namen der Pirateriebekämpfung

Cloudflare warnt vor Overblocking: Netzsperren unter Beschuss

Cloudflare warnt vor Overblocking durch Netzsperren: IP-Blocking trifft oft Unbeteiligte und gefährdet die Stabilität des Internets.

Digitaler Showdown um Seedance 2.0: Hollywood wirft ByteDance massive Urheberrechtsverletzungen vor.

ByteDance unter Piraterie-Verdacht: Disney attackiert Seedance 2.0 wegen Urheberrechtsverletzung

Disney kritisiert Seedance 2.0 wegen möglicher Urheberrechtsverstöße. ByteDance steht unter Piraterie-Verdacht.

Meta-Mitarbeiter protestieren gegen interne Überwachung

Meta-Mitarbeiter protestieren gegen Überwachungssoftware auf Firmen-Laptops – ausgerechnet bei Marc Zuckerbergs Datenkraken-Konzern.

Karikatur eines Smart-TVs mit überquellendem Einkaufswagen, Werbung und Produkten, während ein Zuschauer per Fernbedienung auf YouTube einkauft.

YouTube Shopping-Falle: Impulskäufe per Fernbedienung

YouTube Shopping-Falle: Google macht Smart-TVs zur Verkaufsplattform. Produkte direkt per Fernbedienung kaufen ist perfekt für Impulskäufe.

Wikipedia zieht der KI den Stecker raus

Die Wikipedia verliert nicht nur immer mehr Zugriffe an KI-Portale und -Chatbots. Sie haben auch noch die Kosten für deren Datensammlung.

Ein Moment zwischen Aberglaube und Technologie: Eine Frau vertraut auf die Kaffeesatz-Deutung durch Künstliche Intelligenz – mit unerwarteten Folgen für ihre Ehe.

ChatGPT zerlegt Ehe: KI liest Seitensprung aus Kaffeetasse – Frau reicht Scheidung ein

ChatGPT zerlegt Ehe: Eine Frau in Griechenland verlässt ihren Mann, nachdem die KI in einer Kaffeetasse eine Affäre erkannt haben will.

Spotify zielt mit DMCA-Takedown auf neuen ReVanced-Patch

Spotify geht rechtlich gegen die Open-Source-Patches von Revanced vor, kurz nachdem ein funktionierender Patch entwickelt worden ist.

Anna’s Archive gelingt Zugriff auf die weltweit größte Bücher-Datenbank

Anna's Archive hat WorldCat, die weltweit größte Datenbank für Bücher analysiert. Über eine Milliarde Datensätze müssen nun verarbeitet werden

Homepage des Internet Archive auf einem PC-Bildschirm

Der Urheberrechtsstreit mit dem Internet Archive und seine Folgen

Im Urheberrechtsstreit mit dem Internet Archive ist kein Ende in Sicht. Jetzt kommt es zu weitreichenden Einschränkungen bei der Bibliothek.

Meta AI deaktivieren – Geht das überhaupt?

Kann man die Meta AI endgültig deaktivieren? Viele vertrauen dem Versprechen nicht, dass man die Chats nicht zu Trainingszwecken missbraucht.

Fake-Abmahnungen wegen Urheberrechtsverletzungen im Umlauf

Kriminelle verschicken derzeit massenhaft Fake-Abmahnungen, doch die beauftragte Rechtsanwaltskanzlei aus den USA gibt es gar nicht!!

Wenn zu viele Prompts das System überfordern: Eine KI am Limit.

Multi-Turn-Jailbreaks: Tod durch tausend Prompts bei Open-Weight-LLMs

Multi-Turn-Jailbreaks sprengen die Schutzmechanismen offener KI-Modelle. Cisco meldet Erfolgsraten bis zu 92,78 % bei Open-Weight-LLMs.

Ein durchschnittlicher Webseitenbetreiber, der OpenStreetMap Material einbindet ohne Credit zu geben

OpenStreetMap zieht die Daumenschrauben an

Über 10 Jahre hat OSM nur zugesehen, wie Websites ihre Karten einbinden, ohne die Nutzungsbedingungen zu befolgen. Jetzt ist damit Schluss.

Musikpirat begeht Urheberrechtsverletzung

Urheberrechtsverletzung: Musikpirat drohen zwei Jahre Gefängnis

Ein 60-jähriger Tscheche teilte online ca. 1.000 kommerzielle Musikalben. Es folgte eine Anklage wegen wiederholten Urheberrechtsverletzungen.

AI Agent Coins – 5 kostenlose Tools um sie zu finden

AI Agent Coins sind derzeit einer der stärksten Trends am Krypto-Markt. Wir stellen 5 kostenlose Tools vor, um diese Coins zu finden.

Microsoft hat mehrere KI-Modelle mithilfe einer Jailbreak-Technik namens „Skeleton Key“ dazu gebracht, verbotene Informationen preiszugeben.

Skeleton Key: Angriffsmethode ermöglicht KI-Jailbreak

Der als Skeleton Key bezeichnete Jailbreak-Angriff gestattet einem böswilligen Akteur die vollständige Kontrolle über ein KI-Modell.