Bücher für KI-Training: Meta räumt Verwendung von "raubkopierten" Inhalten ein


Kommentare zu folgendem Beitrag: Bücher für KI-Training: Meta räumt Verwendung von „raubkopierten“ Inhalten ein

Books3 - Dieser Datensatz enthält die gesamte Bibliothek im einfachen .txt-Format, also 197.000 Bücher, die auf genau die gleiche Weise verarbeitet wurden wie für „bookcorpusopen“ (auch bekannt als Books1). Dieser scheint dem mysteriösen „books2“ - Datensatz von OpenAI zu ähneln, auf den in ihren eigenen Artikeln verwiesen wird. Leider macht OpenAI keine Angaben zu den Einzelheiten, daher weiß man nur sehr wenig über etwaige Unterschiede. Viele Spezialisten vermuten, dass sich für die Zusammenstellungen rotzfrech bei "Libgen“ bedient wurde, aber das ist noch nicht komplett bewiesen!

Fazit: Die Ki (AI) Industrie verhält sich quasi, wie die gesamten Content-Piraten! Sie begehen bewiesenermaßen Urheberrechtsverletzungen in hohem Maß und beklauen sich auch noch gegenseitig :bangbang:

:joy: :joy:

1 „Gefällt mir“