Sony Music Group‘s „Declaration of AI Training Opt Out“: Eine sinnvolle Strategie zum Schutz urheberrechtlich geschützter Werke beim KI-Training oder bloß ein zahnloser Tiger?
Die rasante Entwicklung künstlicher Intelligenz (KI) hat einen erheblichen Einfluss auf verschiedenste Bereiche des alltäglichen und rechtlichen Lebens. So hat sie unter anderem auch die Art und Weise verändert, wie und welche Musik wir konsumieren. Beginnend bei personalisierten Musikempfehlungen bis hin zur Schaffung vollständig autonomer Musik nimmt KI einen immer größeren Einfluss auch auf die Musikbranche. Angesichts dieser Entwicklungen stehen Rechteinhaber vor der Herausforderung, den Balanceakt zwischen Förderung technologischer Innovation und dem Schutz ihrer urheberrechtlich geschützten Werke zu bewältigen. Einen bemerkenswerten Schritt in diese Richtung unternahm jüngst die Sony Music Group, indem sie den Einsatz ihrer urheberrechtlich geschützten Werke für KI-Trainingszwecke ausdrücklich und nahezu vollständig untersagte. Dieser Beitrag analysiert die rechtlichen Implikationen des deutschen und europäischen Urheberrechts und diskutiert die Wirksamkeit der "Opt-Out-Lösung" als Mittel zum Schutz geistigen Eigentums.
I. Einleitung
KI-Systeme durchforsten das Internet und werden mit hohen Datenmengen trainiert, zumeist durch eine Extrahierung aus dem Internet im Wege des sog. Scrapings. Aus diesen Datenmengen generiert die Technologie dann neue Daten, die dem Stil der Trainingsdaten ähneln und wodurch es – je nach Art des KI-Modells – zur Erzeugung von Bildern, Texten aber auch von Musik kommen kann. Einen erheblichen Einfluss auf die Zulässigkeit derartige „Generative KI“ hat das Urheberrecht. Nicht nur das Arbeitsergebnis selbst, sondern schon die Nutzung von Daten zu Trainingszwecken kann rechtliche, insbesondere urheberrechtliche Fallstricke bergen. Denn schon der Trainingsvorgang geht in aller Regel mit einer rechtlich relevanten Vervielfältigungshandlung einher, die als Eingriff in die urheberrechtlichen Nutzungs- und Verwertungsrechte der §§ 15, 16 UrhG gewertet werden kann und (soweit nicht gesetzlich ausnahmsweise freigestellt) grundsätzlich dem Zustimmungsvorbehalt des Urhebers oder seines Rechteverwerters unterliegt.
II. Hintergründe der Entscheidung der Sony Music Group
Unter Rückgriff auf diese urheberrechtlichen Grundsätze haben die Sony Music Group und ihre Partner am 16. Mai 2024 in einer Pressemitteilung jede Text- oder Datenauswertung, Websuche oder ähnliche Reproduktion, Extraktion oder Verwendungen jeglichen Inhalts, an denen ihnen Rechte zustehen, einschließlich musikalischer Kompositionen, Texte, Tonaufnahmen, audiovisueller Aufnahmen, Kunstwerke, Bildern und Daten für jegliche Zwecke und zwar ausdrücklich auch im Zusammenhang mit der Schulung, Entwicklung und Kommerzialisierung eines KI-Systems und auf jede Weise ausdrücklich untersagt, soweit dies nach dem jeweils geltenden Recht zulässig ist.[1] Sony Music macht damit ausdrücklich von seiner aus dem Urheberrecht stammenden Entscheidungsbefugnis Gebrauch und erklärt einen so bezeichneten „KI Training Opt Out“. Nach deren Vorstellung sollen KI-Anbieter bei der Suche nach Trainingsmaterial zunächst den Rechteinhaber kontaktieren und mit ihm über (zu vergütende?) Nutzungen verhandeln. Sie sollen gerade nicht zum Training von KI-Technologien frei auf das Repertoire des Musiklabels zugreifen können.
II. Rechtliche Aspekte und Implikationen
Bislang haben viele KI-Systeme urheberrechtlich geschütztes Material für ihr Training verwendet, ohne die ausdrückliche Zustimmung der Rechteinhaber einzuholen. Das Training selbst (also auch ohne die Veröffentlichung eines fertigen Werkes) stellt jedoch bereits in den meisten Fällen im Grundsatz schon eine Verletzung des ausschließlichen Rechts des Urhebers aus § 16 UrhG (sog. Vervielfältigungsrecht) dar. Denn die Sammlung und die Speicherung jedenfalls im Korpus als Datensatz zu fortdauernden Trainingszwecken tangiert nach ganz herrschender Auffassung dieses dem Urheber zustehende Recht. Festzustellen ist, dass Rechteinhaber zunehmend auf die Verletzung ihrer Urheberrechte durch die Verwendung ihrer Werke für das Training von KI-Systemen aufmerksam werden und entsprechend Einwände erheben.
„This case arises from Stability AI’s brazen infringement of Getty Images’ intellectual property on a staggering scale. Upon information and belief, Stability AI has copied more than 12 million photographs from Getty Images’ collection, along with the associated captions and metadata, without permission from or compensation to Getty Images, as part of its efforts to build a competing business”[2]
Mit diesen Worten leitete die Bildagentur Getty Images, Inc. ihre Klage gegen Stability AI, Inc. vor dem US District Court in Delaware ein. Eine Klage, mit der die Agentur die Verletzung von Urheberrechten u.a. durch das von Stability AI betriebene KI-Training unter Verwendung umfangreicher Bildarchive von Getty Images geltend macht. Der Prozess ist einer von vielen derzeit schwerpunktmäßig in den USA geführten Gerichtsprozessen gegen die Entwickler generativer KI. Während die meisten derartiger Verfahren ihren Schauplatz in den Vereinigten Staaten haben, sind nunmehr auch in Deutschland erste Klagen zu verzeichnen. Als Beispiel gilt der Fall Kneschke ./. Laion.[3] Der beklagte LAION e.V. stellt über 5 Milliarden Bilder zu Trainingszwecken von KI-Anwendungen bereit, ohne das Einverständnis der Urheber eingeholt zu haben. Das Verfahren läuft zur Zeit vor dem LG Hamburg, die mündliche Verhandlung ist auf den 11.07.2024 terminiert.
Den Fokus alleine auf das KI-Training und nicht auf den Output des fertigen Werkes gelegt, fasst diese rechtspraktische Entwicklung den Kern des Problems gut zusammen. Es geht um die zentrale Frage, ob – weil eine ausdrückliche Lizensierungspraxis nicht besteht – Rechteinhaber berechtigt und damit in der Lage sind, die Nutzung von urheberrechtlich geschützten Werken zum Zwecke des Sammelns von Trainingsdaten zu unterbinden und von der Gewährung einer Lizenz respektive einer Zustimmung abhängig zu machen.
Schutzschranke des § 44b UrhG
Ein durchsetzbares Recht aus § 16 UrhG kann der Rechteinhaber jedoch nur geltend machen, wenn die Nutzung nicht auch ohne eine Zustimmung des Rechteinhabers zulässig wäre. Dies, nämlich das Recht zur Nutzung ohne Zustimmung des Rechteinhabers, kann nur dann gegeben sein, wenn die konkrete Nutzungshandlung ausnahmsweise durch eine gesetzliche Schrankenbestimmung freigestellt wäre. Für die mit dem KI-Training einhergehende Vervielfältigungshandlung kann in Deutschland eine solche freistellende Bestimmung aufgrund der Schranke des sog. „Text- und Data-Mining“, gesetzlich aus dem Unionsrecht herrührend und verankert in § 44b UrhG, in Betracht kommen. Dies ist Gegenstand der rechtlichen Diskussion. Während in den USA das KI-Datentraining anhand allgemeiner Regeln zumeist unter Rückgriff auf die (in Europa so nicht existente) sog. „Fair Use“-Doktrin gelöst wird, hält das europäische Urheberrecht mit der angesprochenen sondergesetzlichen Vorschrift eine konkrete Regelung bereit, die insoweit weniger flexibel ist, bislang jedoch weder in ihrem Anwendungsbereich noch in ihrem Umfang hinreichend deutlich differenziert und handhabbar ist.
Nach der sog. „TDM-Schranke“ ist die automatisierte Analyse von einzelnen oder mehreren digitalen oder digitalisierten Werken zulässig, um daraus Informationen insbesondere über Muster, Trends und Korrelationen zu gewinnen. Kernvoraussetzung ist hierfür lediglich, dass die Werke rechtmäßig, also ohne Rechtsverstoß abrufbar sind, und zwar ungeachtet der Quelle. Nach der Vorstellung des Richtliniengebers ist es nämlich egal, ob die Werke rechtmäßig abrufbar gestellt worden sind, oder die Quelle selbst „Piraterieware“ liefert (vgl. ErwGr 14 der Richtlinie über das Urheberrecht im digitalen Binnenmarkt, Richtlinie (EU) 2019/790 („DSM-RL“))[4]. Der Nutzer soll alle ihm frei verfügbaren Inhalte speichern dürfen.
Die derzeitig wohl herrschende Auffassung in Deutschland und Europa fasst das Sammeln von Trainingsdaten auch für kommerzielle KI-Modelle unter diese Schranke. Auch in dem vor dem Landgericht Hamburg geführten Verfahren beruft sich LAION auf die TDM-Ausnahme. Dem wird entgegengehalten, dass dies dem gesetzlichen Zweck und der Idee des TDM nicht wirklich entspreche, gerade auch weil zum Zeitpunkt der Normeinführung das Phänomen generativer KI noch gar nicht in der Praxis antizipiert war. Kritik besteht auch mit Blick auf die hinter der TDM-Schranke stehende wirtschaftliche Interessenlage. Die TDM-Schranke des § 44b Abs. 1 UrhG führt im Ergebnis nämlich auch dazu, dass – mit Ausnahme eines ausdrücklich erklärten, wirksamen „Opt-Outs“ – die Nutzung von urheberrechtlich geschützten Werken auch zur Schaffung von Konkurrenzprodukten zulässig wäre, bzw. ist, und zwar, ohne dass dafür eine Vergütung für den Urheber anfallen würde. Im Gegensatz dazu könnte die Gewährung eines Verbietungsrechts unter Ablehnung von § 44b UrhG, aber auch unter Berücksichtigung eines wirksamen Opt-Outs (dazu sogleich), dazu beitragen, einen Markt für Lizenzen schaffen. Dies kommt vor allem den Rechteinhabern zugute, welche ihre Verwertungsinteressen so gegenüber der insoweit lizenzgebührenfreien Nutzung unter der TDM-Schranke berücksichtigt wüssten.
Das Innovationspotential von TDM ist offensichtlich und selbstverständlich auch Sony Music bei ihrem Schritt klar. Denn auch Sony Music macht deutlich, dass KI als kreatives Werkzeug durchaus für die Branche Innovation schaffen kann, mahnt jedoch die angemessene Berücksichtigung der urheberrechtlichen Interessen der bestehenden Aufnahmekünstler an.
Traditionell ist die urheberrechtliche Rechtsprechung in Deutschland urheberfreundlich. Der Schutz des Urhebers, wie auch insgesamt der Schutz des geistigen Eigentums hat in Deutschland sowohl auf Gesetzgebungsebene, aber auch in der Rechtsprechung der Gerichte aller Instanzen – berechtigterweise – ein besonderes Gewicht. Gerade auch aufgrund des Ausnahmecharakters der Norm des § 44b UrhG ist daher nicht ausgeschlossen, dass ein deutsches Gericht – wenn es über die Frage der Nutzung urheberrechtlich geschützter Werke zu Trainingszwecken der KI ohne Einverständnis der Urheber zu entscheiden hat – durchaus geneigt sein könnte, von der Schrankenregelung, die im deutschen Urheberrecht regelmäßig eng ausgelegt werden, für die Fälle des KI-Trainings keinen Gebrauch zu machen. Ein Berufen auf die TDM-Schranke ist daher derzeit mit einem erkennbaren Risiko behaftet.
Wirksames Opt-Out?
Rechteinhabern bleibt, sofern die TDM-Schranke für KI-Trainings greifen würden, die Möglichkeit des Nutzungsvorbehalts nach § 44b Abs. 3 UrhG. Dieser wird in der Praxis derzeit jedoch weitgehend leerlaufen, erfordert er nach den zugrundeliegenden Erwägungsgründen und Gesetzesbegründungen der Richtlinie einen Vorbehalt „in angemessener Weise“; im Onlinebereich gar in maschinenlesbarer Form (vgl. ErwGr 18 Abs. 2 S. 2 DSM-RL; BT-Drs. 19/27426, S. 89[5]). Die große und bisher unbeantwortete Frage ist daher: Kann die Erklärung von Sony Music nach deutschem Verständnis als ein solcher Rechtsvorbehalt, mit dem Sony sich das Recht zur Vervielfältigung zum Zweck des Data Mining vorbehält, angesehen werden? Unzweifelhaft behält sich Sony ausdrücklich Urheberrechte vor. Gilt jedoch eine allgemeine Erklärung auf einer Website, die nicht konkret mit einem Datensatz oder Inhalt verknüpft ist, schon als Vorbehalt „in angemessener Weise“? Dies wird vor dem Hintergrund, dass die Maßnahmen geeignet sein sollen, auch wirklich Beachtung finden zu können,[6] wohl eher zu verneinen sein. Eine natürliche Person und noch weniger ein automatisiertes Programm wie ein Crawler, wird bei der Durchsuchung eine derartige Verknüpfung nicht ohne weiteres herstellen können.
Auch ein wirksamer „Opt-Out“ beseitigt zudem nicht den Störfaktor der Piraterie. Ein wirksamer Nutzungsvorbehalt kann nur dann flankierende Wirkung zeigen, wenn die Werke nicht anderweitig abrufbar sind. Insoweit trifft den Rechteinhaber auch die Bürde, gegen Pirateriewebseiten und -uploads effektive Maßnahmen zu ergreifen. Diese Bürde ist hoch. Denn es ist bis heute schwierig, wenn nicht gar unmöglich, insbesondere wegen der hohen Anonymität und dem hohen Schutz der Diensteanbieter, gegen illegale Uploads und Webseiten umfassend vorzugehen. Dies gerade auch, weil Anbieter oft in Regionen und unter Einsatz von Diensteanbietern agieren, die eine effektive und nachhaltige Rechtsdurchsetzung nahezu unmöglich machen.
Nutzungsrechtevereinbarung als Ausweg?
Die TDM-Schranke selbst läuft also – soweit anwendbar – nur bei rechtssicherem Vorbehalt nach § 44b Abs. 3 UrhG leer. Nur dann würde die Etablierung eines Lizensierungsmarktes ermöglicht. Zu gleichem Ergebnis würde man auch dann kommen, wenn das KI-Training nicht als unter die auf der DSM-RL beruhenden Schrankenbestimmung für Text- und Datamining des §§ 44b UrhG fassen und entsprechend freistellen würde. Bei der Vervielfältigung zum Zwecke des KI-Trainings handelte es sich insoweit dann um eine eigenständige Nutzungsart, die einen enormen Marktwert hätte. Es handelt sich insoweit dann um eine Werknutzung im rechtlichen Sinne, verstanden als jede nach der Verkehrsauffassung wirtschaftlich-technisch selbstständige und abgrenzbare Art und Weise der Verwendung des Werkes.[7]
Auf der Grundlage dieser Definition ist KI wohl im Ergebnis nicht als eigenständige Nutzungsart, sondern eher als ein Sammelbegriff verschiedener technologischer Vorgänge anzusehen. Rechteinhabern ist daher zu raten, sich möglichst umfassend und detailreich die betreffende Verwendung ihrer Werke durch KI oder zum Zwecke des KI-Trainings vorzubehalten. Die Sony Music Group legt hier in ihrer Pressemitteilung bereits eine sinnvolle Variante vor:
any text or data mining, web scraping or similar reproductions, extractions or uses (“TDM”) of any SME and/or SMP content (including, without limitation, musical compositions, lyrics, audio recordings, audiovisual recordings, artwork, images, data, etc.) for any purposes, including in relation to training, developing or commercializing any AI system, and by any means, including by bots, scrapers or other automated processes, in each case to the full extent permitted by applicable law in all relevant jurisdictions.[8]
Anbietern generativer KI ist in umgekehrter Denkrichtung wegen der bestehenden Unsicherheiten als derzeit wohl einzig rechtssichere Möglichkeit der Nutzung von urheberrechtlich geschützten Inhalten als KI-Trainingsdaten die Einholung von Lizenzen respektive Zustimmungen seitens der Rechteinhaber zu empfehlen.
III. Bewertung und Ausblick
Der Fall Sony Music ist nur einer von mehreren repräsentativen Beispielen dafür, welche rechtlichen Implikationen und Ungewissheiten mit dem Einsatz von künstlichen Intelligenzen verbunden sind. Wegen der hohen Reichweite und der hohen Marktbedeutung der Sony Music Group, die das Schreiben an über 700 Unternehmen aus der KI-Entwicklung (auch in der EU) versendet hat, könnte die Vorgehensweise durchaus auf Widerstand stoßen und so eine Klagewelle anstoßen, die insbesondere die Frage der Anwendbarkeit von TDM auf KI-Training einer Klärung zuführen würde. Ebenso wie die Verfahren in den USA und die bislang bekannten Verfahren in Deutschland noch offen sind, bleiben die hieraus abzuleitenden Folgerungen spannend. Auch gilt zu beobachten, welche Wellen in Europa der von Sony Music ausgesprochene „AI Training Opt Out“ schlägt.
Rechteinhabern, die das Recht auf Text und Data Mining vorbehalten und ggf. monetarisieren wollen, sind schon jetzt gut beraten, weitestmöglich den „Opt-Out“ zu erklären, um sich auf diese Weise den Markt für eine Lizensierung zu eröffnen, bzw. offen zu halten. Kehrseitig führt die flankierende Ingebrauchnahme dieser Möglichkeit zu einer Reduzierung der Wirtschaftlichkeit von KI-Systemen, können Lizenzvereinbarungen in einem Umfang schon allein von der Sony Music Group als eines der Major-Labels in der Tonträgerindustrie doch unwirtschaftlich hohe Transaktionskosten auslösen. Dieser monetäre Aspekt kann von seinen Auswirkungen auf die KI-Landschaft zu einem Verlust Europas als Zentrum für Innovation führen.
Obwohl die rechtliche Lage im europäischen Rechtskreis und anderen wichtigen Jurisdiktionen wie den USA bisher unklar ist, ist es entscheidend, dass Europa sich zu einem rechtssicheren Umgang mit geistigen Eigentumsrechten beim Training von KI positioniert. Künstliche Intelligenz ist ein wirtschaftlich bedeutendes Zukunftsthema. Daher ist es wichtig, dass die Rechtsentwicklung – sowohl in Gesetzgebung als auch in Rechtsprechung – den internationalen Kontext und die jeweiligen Entwicklungen berücksichtigt. Europa muss klare Rahmenbedingungen für die KI-Entwicklung schaffen, um insoweit im globalen Wettbewerb wettbewerbsfähig zu bleiben.
Die rechtlichen Möglichkeiten des Trainings von KI-Modellen sind in Deutschland und Europa noch nicht angemessen umgesetzt. Auch der nunmehr endgültig beschlossene EU AI Act[9] verhält sich zu den immaterialgüterrechtlichen Implikationen nicht schwerpunktmäßig. Die Union hat hier einen eher kleineren Vorstoß unternommen. Erwägungsgrund 105 erklärt lediglich, dass die Nutzung von urheberrechtlich geschützten Werken ausdrücklich unter einem Genehmigungsvorbehalt stehe, sofern eine Schranke nicht eingreife. Die TDM-Schranke aus der DRM-Richtlinie solle jedoch weiterhin anwendbar sein. Konkrete Bestimmungen zu den Ausnahmen betreffend das Urheberrecht sind jedoch nicht in das verabschiedete Gesetz eingearbeitet worden.
In dem Maße, wie sich die Vorschriften weltweit weiterentwickeln, werden sie wahrscheinlich auch die deutsche Gesetzgebung und Praxis beeinflussen, so dass ein ausgewogener Ansatz erforderlich ist, der den technologischen Fortschritt und den Schutz kreativer Werke unterstützt. Mit der zunehmenden Rolle von KI als Schlüsseltechnologie, die ein rapides Wachstum verzeichnet,[10] besteht ein dringender – insbesondere gesamteuropäischer – Handlungsbedarf, um als Europa nicht den Anschluss zu diesem Technologiepotential zu verlieren.
[1] https://www.sonymusic.com/sonymusic/declaration-of-ai-training-opt-out/.
[2] https://storage.courtlistener.com/recap/gov.uscourts.ded.81407/gov.uscourts.ded.81407.1.0.pdf.
[3] Zum Verfahren ausführlich bpsw. der Beitrag von Silke Hahn bei Heise-Online, abrufbar unter https://www.heise.de/hintergrund/Was-darf-KI-Stockfotograf-und-KI-Verein-streiten-um-das-Copyright-8984836.html.
[4] Der vollständige Text der Richtlinie ist abrufbar unter https://eur-lex.europa.eu/legal-content/DE/TXT/PDF/?uri=CELEX:32019L0790.
[5] https://dserver.bundestag.de/btd/19/274/1927426.pdf.
[6] So ausdrücklich in Erwägungsgrund 18 Abs. 2 S. 5 der DSM-RL.
[7] BGH, Urteil vom 10.6.2009, Az. I ZR 226/06 – Nutzung von Musik für Werbezwecke, Rn. 18.
[8] https://www.sonymusic.com/sonymusic/declaration-of-ai-training-opt-out/.
[9] Der vollständige Gesetzestext ist abrufbar unter https://artificialintelligenceact.eu/de/das-gesetz/.
[10] Vgl. bspw. die Prognose von Next Move Strategy Consulting über das Marktvolumen von KI weltweit bis 2030, abrufbar unter https://de.statista.com/statistik/daten/studie/1405265/umfrage/kuenstliche-intelligenz-marktvolumen/.
Author