KI & Urheberrecht: Memorisierung ist eine Urheberrechtsverletzung

„Atemlos durch die Nacht“ tanzte die GEMA wohl diese Woche, nachdem das LG München zu ihren Gunsten entschieden hat: die Erinnerung an vollständige Liedtexte ist zwar eine bühnenreife Leistung. Jedoch nicht, wenn diese urheberrechtlich geschützten Werke vollumfänglich von KIs wiedergegeben werden. Das sorgte für ordentlich Herzklopfen im Urheberrecht!

Hintergrund des Verfahrens

Die GEMA, die Verwertungsgesellschaft für Urheberrechte im Musikbereich, hatte Klage eingereicht, da Liedtexte mehrerer bekannter deutscher Künstler – darunter „Atemlos“ von Kristina Bach und „Wie schön, dass du geboren bist“ von Rolf Zuckowski – in den Sprachmodellen von OpenAI originalgetreu wiedergegeben wurden. Nutzer konnten die Texte dank der Speicherung (Memorisierung) durch die KI mittels Eingabe einfacher Prompts abrufen.

OpenAI entgegnete den Vorwürfen damit, dass ihre Modelle keine konkreten Daten speicherten, sondern lediglich statistische Wahrscheinlichkeiten. Zudem sei der jeweilige Nutzer für die durch seine Eingaben erzeugten Inhalte verantwortlich. Etwaige Vervielfältigungen seien zudem durch die Schranke des Text- und Data-Mining (§ 44b UrhG) gedeckt.

Die Entscheidung des Landgerichts München I

Das Gericht folgte in seinem Urteil (Az. 42 O 14139/24) weitgehend der Argumentation der GEMA. Nach Ansicht der 42. Zivilkammer sind sowohl die Memorisierung der Liedtexte in den Modellen als auch ihre Wiedergabe in den Ausgaben („Outputs“) als urheberrechtlich relevante Vervielfältigungen im Sinne von § 16 UrhG und Art. 2 InfoSoc-RL zu werten.

Memorisierung als Vervielfältigung

Die Kammer stellte fest, dass die Liedtexte reproduzierbar in den Modellen enthalten sind. Diese „Memorisierung“ stellt eine Form der Verkörperung dar, die die urheberrechtliche Vervielfältigung erfüllt. Dabei ist unerheblich, dass die Wiedergabe durch Wahrscheinlichkeitswerte oder neuronale Gewichtungen erfolgt. Entscheidend ist, dass die Texte technisch wiederhergestellt werden können – eine „mittelbare Wahrnehmbarkeit“ genügt.

Keine Anwendung der Text- und Data-Mining-Schranke (§ 44b UrhG)

Zwar fällt das Training von KI-Systemen grundsätzlich in den Anwendungsbereich dieser Schranke. Nach Auffassung des Gerichts ist sie jedoch nicht anwendbar, wenn – wie hier – die Werke nicht nur analysiert, sondern tatsächlich vervielfältigt werden.
Die Schranke soll ausschließlich vorbereitende Analysevorgänge ermöglichen, bei denen keine Verwertungsinteressen des Urhebers berührt werden. Eine erweiternde oder analoge Anwendung lehnte die Kammer ab. Sie betonte, dass eine solche Auslegung die Rechteinhaber schutzlos stellen würde.

Kein „unwesentliches Beiwerk“ (§ 57 UrhG)

Auch eine Einordnung der Liedtexte als unwesentliches Beiwerk lehnte das Gericht ab. Der gesamte Trainingsdatensatz sei kein Werk im urheberrechtlichen Sinn, sodass eine Nebenordnung der Liedtexte nicht in Betracht komme.

Keine Einwilligung der Rechteinhaber

Das Training von Sprachmodellen ist keine übliche Nutzungsart, mit der Urheber rechnen müssten. Eine stillschweigende Einwilligung liegt daher nicht vor.

Urheberrechtsverletzung durch Outputs

Neben der Memorisierung bejahte das Gericht auch eine Verletzung durch die Wiedergabe der Texte in Chatbot-Ausgaben. Die originellen Elemente der Lieder waren dabei klar erkennbar. Für diese Ausgaben ist OpenAI selbst verantwortlich – nicht die Nutzer. Die Modelle sind durch OpenAI konzipiert, trainiert und betrieben worden, sodass die inhaltliche Gestaltung der Outputs dem Unternehmen zuzurechnen ist.

Abgrenzung zum Urteil des LG Hamburg

Natürlich stellt sich beim lesen des Urteils des Gerichts des LG München sogleich die Frage, wie es denn mit dem Urteil des LG Hamburg zur Erstellung von KI-Trainingsdatensätzen zusammenpasst (wir hatten berichtet). Denn das Hamburger Gericht hatte im vergangenen Jahr die urheberrechtliche Zulässigkeit der Erstellung solcher Datensätze nach § 60d UrhG bestätigt. Der entscheidende Unterschied im vorliegenden Fall besteht jedoch darin, dass urheberrechtlich geschützte Werke nicht nur zur Erstellung von Datensätzen verwendet wurden, sondern eine tatsächliche Vervielfältigung in Form der Memorisierung stattfand. Die Werke wurden von der KI demnach nicht nur analysiert, sondern auch aktiv vervielfältigt.

Bewertung und Ausblick

Das Urteil ist noch nicht rechtskräftig. OpenAI kann gegen die Entscheidung Rechtsmittel einlegen.

Gleichwohl setzt die Entscheidung ein deutliches Signal: Das Gericht bestätigt, dass KI-Modelle, die urheberrechtlich geschützte Werke memorisieren und reproduzieren, eine Vervielfältigung darstellen können – auch wenn diese in abstrakten Datenparametern erfolgt.

Damit stellt sich das Landgericht München I klar gegen eine weitgehende Privilegierung des KI-Trainings durch die Schranke des Text- und Data-Mining. Für KI-Entwickler und Plattformbetreiber bedeutet dies, dass die Nutzung urheberrechtlich geschützter Werke im Trainingsprozess künftig noch genauer geprüft und lizenziert werden muss.

Foto von charlesdeluvio auf Unsplash

KI & Urheberrecht: Memorisierung ist eine Urheberrechtsverletzung

Google muss Phishing-Anzeigen vorbeugend löschen

Update zur Einführung des Widerrufsbuttons