Das Logo von Nvidia auf dem Bildschirm eines Smartphones
Das Logo von Nvidia auf dem Bildschirm eines Smartphones
Bildquelle: David1992, Lizenz

Autoren vs. NVIDIA: Ist KI-Training mit geschützten Texten legal?

NVIDIA verteidigt sich vor Gericht. Der Vorwurf: Verwendung von urheberrechtlich geschützten Büchern für das Training seiner KI-Modelle.

Der Boom der künstlichen Intelligenz bringt nicht nur technischen Fortschritt, sondern auch knifflige Rechtsfragen mit sich. Das bekommt derzeit der Chip-Riese NVIDIA zu spüren. Mehrere Autoren haben den KI-Pionier verklagt – der Vorwurf: NVIDIA habe urheberrechtlich geschützte Bücher verwendet, um seine KI-Modelle zu trainieren. Doch so einfach ist die Sache nicht. Denn NVIDIA beteuert in einer aktuellen Klageerwiderung seine Unschuld.

Autoren vs. NVIDIA: Worum es hier geht

Eine Gruppe von Autoren, darunter Bestsellerautoren wie Abdi Nazemian, hat den KI-Giganten NVIDIA verklagt. Der Grund: Das Unternehmen soll für das Training seiner KI massenhaft Bücher genutzt haben – darunter auch die Werke der klagenden Autoren. Besonders heikel an der Geschichte ist der sogenannte Books3-Datensatz.

Dieser Datensatz enthält angeblich Millionen von Büchern aus der inzwischen berüchtigten Schattenbibliothek Bibliotik. Nun, nicht ganz legal, das dürfte klar sein. Aber genau diesen Books3-Datensatz soll NVIDIA für seine KI-Modelle genutzt haben. So jedenfalls der Vorwurf der Kläger und Ausgangspunkt des Rechtsstreits Autoren vs. NVIDIA.

Der Chip-Riese beruft sich auf faire Nutzung

NVIDIA bestreitet die Vorwürfe vehement. In einer offiziellen Stellungnahme räumt das Unternehmen zwar ein, den Datensatz „The Pile“ mit Books3 verwendet zu haben, betont aber, keine Urheberrechtsverletzungen begangen zu haben. Insbesondere weist NVIDIA den Begriff „Schattenbibliothek“ zurück, der häufig für raubkopierte Büchersammlungen genutzt wird.

In der Klageerwiderung betont NVIDIA, dass die Nutzung der Daten nach US-Recht zulässig sei und keine Urheberrechtsverletzung vorliege. Außerdem bestreitet das Unternehmen, mehrere Kopien des Books3-Datensatzes angefertigt zu haben. NVIDIA weist außerdem darauf hin, dass es sich bei der Klage nicht um eine Sammelklage nach Bundesrecht handelt.

Laut NVIDIA hat das KI-Training kein Urheberrecht verletzt
Laut NVIDIA hat das KI-Training kein Urheberrecht verletzt

Die Antwort von NVIDIA auf die Klage ist eindeutig: Das Unternehmen sieht keine Urheberrechtsverletzung und beruft sich auf Fair Use. Es gibt keine Gegenklage von NVIDIA und die Autoren haben nun vier Wochen Zeit, auf die Erwiderung zu reagieren. Dies berichtet TorrentFreak in einem aktuellen Artikel.

Wie weit dürfen KI-Unternehmen gehen?

Am Ende bleibt die spannende Frage: Wie weit dürfen KI-Unternehmen gehen, um ihre Modelle zu trainieren? Dürfen sie einfach alles verwenden, was im Internet kursiert? Oder muss KI-Training strenger reguliert werden?

Der Fall NVIDIA könnte hier für mehr Klarheit sorgen – oder aber die Situation noch undurchsichtiger machen. Klar ist: In Sachen KI und Urheberrecht besteht dringender Handlungsbedarf durch den Gesetzgeber!

(*) Alle mit einem Stern gekennzeichneten Links sind Affiliate-Links. Wenn Du über diese Links Produkte oder Abonnements kaufst, erhält Tarnkappe.info eine kleine Provision. Dir entstehen keine zusätzlichen Kosten. Wenn Du die Redaktion anderweitig finanziell unterstützen möchtest, schau doch mal auf unserer Spendenseite oder in unserem Online-Shop vorbei.

Über

Sunny schreibt seit 2019 für die Tarnkappe. Er verfasst die wöchentlichen Lesetipps und berichtet am liebsten über Themen wie Datenschutz, Hacking und Netzpolitik. Aber auch in unserer monatlichen Glosse, in Interviews und in „Unter dem Radar“ - dem Podcast von Tarnkappe.info - ist er regelmäßig zu hören.