Urheberrecht und KI: Wie gut schützen einfache Urheberrechtshinweise vor KI-Nutzung?
Urheberrecht und KI: Wie gut schützen einfache Urheberrechtshinweise vor KI-Nutzung?
Die Diskussion um die Nutzung von künstlicher Intelligenz (KI) im Zusammenhang mit urheberrechtlich geschützten Werken gewinnt zunehmend an Fahrt. Erst jüngst hat das Landgericht Hamburg in einer richtungsweisenden, weil ersten Entscheidung die Zulässigkeit von Webscraping zum Zwecke des KI-Trainings zu entscheiden gehabt.[1] Nun hat der weltgrößte Fachverlag Penguin Random House (PRH) in Reaktion auf die KI-Entwicklung seine Copyright-Erklärungen überarbeitet und der Nutzung seiner Werke durch KI untersagt.[2] Wie wirksam ein solcher Nutzungsvorbehalt gerade auch vor dem Hintergrund der Entscheidung des Landgerichts Hamburg ist, analysiert dieser Beitrag. Er setzt unseren letzten Blogbeitrag „Sony Music Group‘s „Declaration of AI Training Opt Out“: Eine sinnvolle Strategie zum Schutz urheberrechtlich geschützter Werke beim KI-Training oder bloß ein zahnloser Tiger?“ fort.
Das Spannungsverhältnis zwischen KI-Training und Urheberrecht
KI wird zunehmend genutzt, um große Mengen an Daten aus dem Internet zu sammeln und zu verarbeiten. Dies geschieht häufig im Wege des sog. Web oder Data Scrapings. Dieser Prozess ermöglicht es KI-Systemen, Muster zu erkennen und auf Grundlage dieser Daten zu lernen. Diese Methode ist sowohl für kommerzielle Anbieter als auch für Forschungszwecke attraktiv, da das Internet eine reichhaltige und ständig aktualisierte Datenquelle bietet. Davon sind häufig auch urheberrechtlich geschützte Werke betroffen. Diese Art und Weise der Auswertung urheberrechtlich geschützter Werke ist daher zurecht Gegenstand juristischen Diskurses und stellt Urheber wie KI-Entwickler vor Herausforderungen. Im Kern geht es hierbei um die Frage, ob die Verwendung von urheberrechtlich geschützten Werken für das Training von KI-Systemen durch bestehende Ausnahmeregeln im Urheberrecht gedeckt sind. Eine solche stellt die sog. Text- und Data-Mining-Regelung dar, die im deutschen Urheberrecht in den §§ 44b, 60d UrhG gesetzlich verankert ist. Bejaht man deren Anwendbarkeit, hat dies zur Folge, dass die Werknutzung erst einmal aus dem (lizenzpflichtigen) Verwertungsbereich der Urheber herausgenommen und somit freigestellt wird. Mit Blick auf die urheberrechtlich geschützten Verwertungsinteressen der Urheber wird dies zurecht kritisiert. Das Landgericht Hamburg hat hier gleichwohl jüngst entschieden, dass die Regelungen für das Text- und Data-Mining auch auf das Training generativer KI-Systeme grundsätzlich angewendet werden können. Diese Entscheidung begegnet im Schrifttum erheblicher Kritik, es wird abzuwarten bleiben, ob die Entscheidung des Landgerichts Hamburg Bestand haben wird.
Die Entscheidung des Landgerichts Hamburg
In dem Fall, der vor dem Landgericht Hamburg verhandelt wurde, ging es um die Frage, ob der gemeinnützige Verein LAION e.V., dessen Ziel es ist, offene Datensätze, Werkzeuge und Modelle bereitzustellen, um die Forschung im Bereich des maschinellen Lernens zu unterstützen, gestattet ist, eine Datenbank aufzusetzen und bereitzustellen, die fast 6 Milliarden Bild-Text-Paare beinhaltet, und die für das Training von KI-Systemen genutzt werden kann. Ein Fotograf, dessen Werke in dieser Datenbank verwendet wurden, versuchte im Ergebnis erfolglos, die Nutzung seines Materials gerichtlich zu untersagen. Das Gericht entschied zugunsten der KI-Entwickler, dass die Schrankenregelung für das Text- und Data-Mining auch auf KI-Trainings anwendbar ist, was in letzter Konsequenz den Urhebern einen Teil ihrer Kontrolle über die Nutzung und Verwertung ihrer Werke entziehen könnte. Zwar hat – dazu sogleich – die Entscheidung auch urheberfreundliche Tendenzen. Zurecht zu kritisieren ist jedoch, dass das Gericht davon ausgegangen ist, dass der Beklagte forschend tätig sei und sich daher auf die Ausnahmeregelung des § 60d UrhG berufen könne, bei dessen Anwendung das Gericht die Messlatte unangemessen niedrig angesetzt hat. Das führt zu dem Ergebnis, dass es für die Anwendbarkeit der Ausnahmeregelung unbeachtlich ist, wer die bereitgestellten Trainingsdaten im Nachgang (sei dies kommerziell oder auch nicht-kommerziell) nutzt, solange die eigentliche Vervielfältigungshandlung von einem „wissenschaftlich forschenden “ Verein vorgenommen wird. Aus Urhebersicht führt eine solche weite Auslegung der wissenschaftlichen Zweckbestimmung damit zu einem ungerechtfertigten Risiko und Unterlaufens des Schutz- und Ausnahmecharakters dieser Vorschrift. Aus dem Sinn und Zweck spricht einiges dafür, die den Schutzbereich der Urheber begrenzende Schrankenbestimmung (anders als vom Landgericht vorgenommen) eng zu fassen und die Anforderungen an die Forschungsannahme vielmehr hoch anzusetzen. Nur so können die Interessen der Urheber angemessen berücksichtigt werden.
Es bleibt abzuwarten, ob die Überlegungen des Landgerichts Hamburg auch in der weiteren Rechtsprechung insbesondere der Oberlandesgerichte oder auch des Bundesgerichtshofs Bestand haben werden. Grundlegendes Ziel des Urheberrechts ist es nämlich, den Schöpferinnen und Schöpfern eine angemessene Beteiligung an der wirtschaftlichen Verwertung ihrer Werke zu ermöglichen.[3] Das Training von generativen KI-Systemen verläuft hier an einer entscheidenden Grenze zwischen der bloßen (in den Werken liegenden) Informationsverarbeitung und der Betroffenheit wirtschaftlicher Interessen der Urheber. Denn die durch das KI-Training im Ergebnis erzeugten Werke, insbesondere im kommerziellen Bereich, sind häufig dazu bestimmt, in direkten Wettbewerb mit den originalen Werken zu treten, die im Rahmen des Trainings verwendet wurden. Gerade deshalb benötigen Urheberinnen und Urheber eine klare und rechtssichere Möglichkeit, ihre Werke von solchen Nutzungen auszuschließen ("Opt-Out"). Dies wirft die Frage auf, inwiefern Urheberinnen und Urheber weiterhin die Möglichkeit haben, ihre Werke auch weiterhin – und auch in Bezug auf die Nutzung durch KI – wirtschaftlich sinnvoll verwerten zu können.
Die Entscheidung von Penguin Random House
Unabhängig von der Entscheidung des Landgerichts Hamburg, aber ausdrücklich unter Bezugnahme auf die europäischen Vorgaben zum Text- und Data Mining, hat die Verlagsgruppe Penguin Random House – wie auch schon zuvor die Sony Music Group (hier zum diesbezüglichen Beitrag) – ihre globalen Copyright-Erklärungen angepasst und um eine neue Bestimmung ergänzt, die ausdrücklich die Nutzung ihrer Werke zum Zwecke des Trainings von KI-Systemen verbietet. Danach findet sich in den neuen Bestimmungen folgende Passage:
"Kein Teil dieses Buches darf in irgendeiner Weise zum Zweck des Trainings künstlicher Intelligenztechnologien oder -systeme verwendet oder reproduziert werden.“
Im Urheberrecht schafft die Voraussetzung eines solchen Nutzungsvorbehaltes § 44b Abs. 3 UrhG, der einen solchen Vorbehalt ausdrücklichen explizit zulässt.
§ 44b Text und Data Mining
(1) Text und Data Mining ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen.
(2) Zulässig sind Vervielfältigungen von rechtmäßig zugänglichen Werken für das Text und Data Mining. Die Vervielfältigungen sind zu löschen, wenn sie für das Text und Data Mining nicht mehr erforderlich sind.
(3) Nutzungen nach Absatz 2 Satz 1 sind nur zulässig, wenn der Rechtsinhaber sich diese nicht vorbehalten hat. Ein Nutzungsvorbehalt bei online zugänglichen Werken ist nur dann wirksam, wenn er in maschinenlesbarer Form erfolgt.
Diese Vorschrift fordert, damit der Nutzungsvorbehalt rechtlich auch wirklich wirksam ist, das er in einer maschinenlesbaren Form vorliegt. Die rechtlichen Anforderungen hieran sind komplex und unterliegen bisweilen unterschiedlicher Interpretationen in Rechtsliteratur und Rechtsprechung. Das Landgericht Hamburg hat hier eine eher urheberfreundliche Position eingenommen, indem es eine grundsätzliche „Maschinenlesbarkeit“ für ausreichend erachtet. Dies hat zur Folge, dass – im Einzelfall – auch ein rein textbasierter Vorbehalt wirksam sein könnte. Damit wäre die von PRH etablierte Formulierung durchaus geeignet, die KI-Nutzung auszuschließen.
In der Rechtsliteratur wird hiergegen bis dato vorrangig die Ansicht vertreten, dass ein solcher Vorbehalt nur dann wirksam sei, wenn er „in angemessener Weise“ erfolgt (vgl. ErwGr 18 Abs. 2 S. 2 DSM-RL; BT-Drs. 19/27426, S. 89). Danach sollen die Maßnahmen so gestaltet sein, dass sie tatsächlich Beachtung finden können. Entscheidend ist hierfür – ungeachtet des Einbettungsortes – die tatsächliche Maschinenlesbarkeit. Es sei sicherzustellen, dass bei online zugänglichen Inhalten automatisierte Abläufe erfolgen können, in dessen Rahmen der Nutzungsvorbehalt auch tatsächlich von der Technologie erfasst werden kann. Maßgebliches Entscheidungskriterium ist also die Frage, ob ein Crawler in der Lage ist, den Nutzungsvorbehalt als solchen zu identifizieren und zu erkennen. Ob das auch ein in Textform verfasster Vorbehalt ist, ist daher umstritten.
Zuzustimmen ist nach diesseitiger Auffassung zumindest der Auslegung des Landgerichts Hamburgs, wonach eine „Maschinenverständlichkeit“ als Kriterium ausreichen soll. Dies ist zurecht urheberfreundlich, bringt aber auch derzeit Unsicherheiten mit sich. Es ist zwar nicht auszuschließen, dass es künftig mit fortschreitender Technologie möglich sein wird, Nutzungsvorbehalte, die in Textform vorliegen, automatisiert und im weiten Umfang zu erfassen. Das Gericht betont jedoch, dass es sich hierbei nicht um eine allgemeine Regel handelt, sondern es auf den jeweiligen Einzelfall ankomme, wobei insbesondere die technische Entwicklung zum Zeitpunkt der Nutzung des Werks berücksichtigt werden müsse. Das ist folgerichtig. Bis eine solche Technologie zum Stand der Technik gehört, kann es unter Umständen bei entsprechender Darlegung, dass eine solche technische Möglichkeit nicht gegeben ist, vorkommen, dass ein rein in Textform verfasster Rechtevorbehalt als nicht ausreichend erachtet wird, unzwar insbesondere dann, wenn nachgewiesen wird, dass eine derartige Technologie im konkreten Fall nicht verfügbar war.
Implikationen auf die Kreativwirtschaft
Die Änderungen von Penguin Random House und die Entscheidung des Landgerichts Hamburg stellen einen (zumindest in Teilen) bedeutsamen Schritt in Richtung eines stärkeren Schutzes von Urheberrechten auch im Kontext von KI dar. Diese Entwicklungen sind für alle Autoren und Kreative von Relevanz. Es liegt in der Verantwortung vor allem der Urheberinnen und Urheber, ihre Werke durch entsprechende Vorkehrungen vor ungewollter Nutzung zu schützen. Grundlegendes Ziel des Urheberrechts ist es, den Schöpferinnen und Schöpfern eine angemessene Beteiligung an der wirtschaftlichen Verwertung ihrer Werke zu ermöglichen. Dies vor allem in dem sich abzeichnend größer werdenden Konflikt zwischen Kreativität und Technologie.
Bewertung und Ausblick
Der Schutz kreativer Leistungen liegt im Aufgabenbereich aller Beteiligten. Die Maßnahmen von Penguin Random House können derzeit als Vorbild für andere Urheber und Rechteverwerter dienen. Gleichzeitig müssen Urheberinnen und Urheber ihre Rechte aktiv verteidigen und sich an den laufenden Debatten über Webscraping und KI beteiligen und die Entwicklungen beobachten. Gerade auch das Urteil aus Hamburg zeigt die Notwendigkeit eines starken rechtlichen Rahmens zum Schutz von Urheberrechten. Es bleibt daher abzuwarten und zu beobachten, wie sich die Rechtsprechung hierzu entwickeln wird und ob die vom Landgericht Hamburg eingeschlagene Richtung Bestand haben wird. Die Regelungen zum Text- und Data Mining sind unionsrechtlich harmonisiert, was bedeutet, dass auch die Entwicklungen in anderen Mitgliedstaaten der EU von Bedeutung sein werden. Diese Entwicklungen sind letztlich entscheidend, wie zukünftige Regelungen in Bezug auf das Training von KI-Systemen ausgestaltet werden und berühren damit auch den Erfolg technologischer Entwicklung im europäischen Rechtsraum.
[1]https://openjur.de/u/2495651.html
[2]https://www.heise.de/news/Urheberrecht-Penguin-Random-House-will-Buchautoren-vor-KI-Ausbeutung-schuetzen-9987564.html
[3]Dreier/Schulze/Dreier, UrhG § 11 Rn. 1
Author