OER, generative KI und fremde Werke

Im letzten Monat haben wir darüber berichtet, wie OER mit KI-Inhalten am besten zu lizenzieren sind.  Zwei weitere Fragen im Kontext von KI und OER werden derzeit häufig gestellt: Können KI-Systeme auf OER zurückgreifen, um ihre Modelle zu trainieren? Und: Darf ich beim Einsatz von KI-Generatoren wie ChatGPT, DALL-E oder DiffusionBee fremde Inhalte zum Prompten verwenden?

OER, generative KI und fremde Werke
OER, generative KI und fremde Werke, Screenshot: iRights, Grafik: Angela Karnoll (via Canva), CC-BY 4.0

Ein Beitrag von Fabian Rack

Lernen aus Bestehendem

KI-Generatoren basieren auf Modellen zur Sprach- oder Bilderzeugung, die sich aus Milliarden von Website-Daten und Inhalten im Netz speisen. Diese Inhalte sind ihrer Art nach nicht begrenzt: Von Online-Zeitungen, wissenschaftlichen Artikeln und Romanen bis hin zu Unternehmenstexten, frei einsehbaren Regierungsdokumenten (etwa von der Europäischen Union), Reden, Comedy-Auftritten oder OER-Inhalten kann prinzipiell jeder Text zum Trainingsmaterial werden.

Einige Kreative klagen derzeit dagegen, dass Betreiber von KI-Systemen die Modelle ohne Zustimmung mit ihren Werken füttern. Die Rechtslage ist kompliziert, lässt sich aber auf die Frage herunterbrechen, ob gesetzliche Urheberrechtserlaubnisse greifen: Diese wären in den USA die „Fair Use“-Regelung und in der EU eine neuere Urheberrechtserlaubnis für Machine-Learning. Viele Gründe sprechen dafür, aber geklärt ist diese Frage derzeit nicht.

OER zum Trainieren von Modellen

Muss man OER ausdrücklich freigeben, damit KI-Modelle damit trainiert werden können? Die kurze Antwort: Nein. Der Grund: Schon die freien Lizenzen, die für das „Open“ in Open Educational Resources sorgen, erlauben dies. Wie zuvor erwähnt, ist es vermutlich auch gesetzlich zulässig (in Deutschland nach § 44b Urheberrechtsgesetz) – die freien Lizenzen räumen dann noch die letzten Zweifel aus. KI-Modelle können also ohne weiteres Vorgehen mit OER trainiert werden.  Was aber ist, wenn man verhindern möchte, dass dies geschieht? Viele Betreiber von KI-Systemen beachten maschinenlesbar erklärte Nutzungsvorbehalte – und sind gesetzlich sogar dazu verpflichtet. Allerdings stehen die freie Lizenzierung (vertragliche Erlaubnis) und das technisch erklärte Opt-Out (erklärtes Verbot) zueinander im Widerspruch. Zudem ist zweifelhaft, ob die OER-Community solche Opt-Outs mit dem Begriff „open“ als vereinbar ansieht.

Fremde Werke als Prompts von generativer KI

Schließlich stellt sich die Frage: Darf ich mit fremden Werken prompten und somit etwas Neues mit KI erstellen? Mit Fremdcontent zu prompten, ist zunächst einmal urheberrechtlich unbedenklich, solange es privat bleibt. Wer das Ergebnis veröffentlichen möchte, muss darauf achten, ob der Fremdcontent – oder Teile daraus – noch enthalten sind. Wenn dies der Fall ist, gilt:

– Ist das verwendete Werk frei lizenziert (insbesondere Wikipedia-Content), müssen der Lizenzhinweis und der Hinweis auf die Bearbeitung
– Sofern das verwendete Werk nicht frei lizenziert ist („Alle Rechte vorbehalten“), darf das Ergebnis nicht ohne weitere Prüfung einer Erlaubnis geteilt werden.
– Ist das verwendete Werk gemeinfrei, gibt es keine Einschränkungen beim Veröffentlichen.
 

Fallbeispiele

Was unproblematisch möglich ist:

  1. Zusammenfassungen und Bildbeschreibungen: Gibt man dem KI-System ein Fragment aus einem Roman oder einen Zeitungsartikel und bittet es, eine Zusammenfassung zu schreiben, so ist dies zulässig. Man muss darauf achten, dass die Zusammenfassung nicht originelle Formulierungen aus dem verwendeten Werk übernimmt, sondern die Fakten in eigenen Worten wiedergibt. Hintergrund: Originelle, das heißt Schöpfungshöhe erreichende Formulierungen gelten als Werke im Sinne des Urheberrechts und sind damit schutzfähig.
  2. Ein geschütztes Bild mit dem Befehl „Erstelle mir etwas Ähnliches in diesem Stil“ zu prompten, ist zulässig. Stile sind nämlich nicht urheberrechtlich geschützt. Aber Vorsicht: „Gib mir dieses Motiv in einem anderen Stil aus“ ist bei einem originellen, urheberrechtlich geschützten Motiv hingegen eine Bearbeitung.

 
Was nicht (oder nicht einfach so) geht:

  1. „Outpaintings“ (ein Bild über den Rahmen hinaus „weitermalen“ lassen) oder „Inpaintings“ (Elemente im Bild hinzufügen, ersetzen oder entfernen): Dabei handelt es sich in der Regel um Bearbeitungen. Die Ergebnisse dürfen nur geteilt werden, wenn die Vorlage gemeinfrei oder frei lizenziert ist – oder wenn hierfür eine Erlaubnis vorliegt.
  2. Übersetzungen eines Textes sind unfreie Bearbeitungen. Sie öffentlich zu teilen, bedarf der Erlaubnis.

 

Screenshot: iRights, nicht unter freier Lizenz
Doch nicht so intelligent – oder liegt’s am Prompt? Der Versuch, mit dem Generator DiffusionBee ein Gemälde zu reproduzieren und es wie eine Fotografie aussehen zu lassen, scheitert. Urheberrechtlich ist die Situation wie folgt: Das verwendete Werk („Musiker in der Oper“ von Edgar Degas aus dem Jahr 1872) ist gemeinfrei, das erzeugte Bild rechts auch. Hätte DiffusionBee das Motiv reproduziert, könnte ich das Bild ohne Probleme teilen – denn die Vorlage ist hier frei von Urheberrechten. Wäre die Vorlage hier urheberrechtlich geschützt, ist das freie Teilen des Bildes ebenfalls erlaubt. Denn: Der Output reproduziert die Vorlage nicht – oder zumindest nicht erkennbar.
 

Fazit

OER zu teilen bedeutet, sie auch zum Trainieren von KI-Modellen freizugeben. Und wer bei der OER-Erstellung generative KI einsetzt, muss dabei fremde Rechte wahren. Vorsichtig sollte man besonders dann sein, wenn sich fremde Werke oder Teile hiervon im KI-Output wiederfinden.


Weitere Beiträge aus dieser Reihe:

 

Creative Commons LizenzvertragDieser Text steht unter der CC BY 4.0-Lizenz. Der Name des Urhebers soll bei einer Weiterverwendung wie folgt genannt werden: Fabian Rack, iRights für OERinfo

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Bitte beachten Sie auch unsere Datenschutzerklärung.