Eine Gruppe von 17 Autoren, darunter der Game of Thrones-Romanautor George RR Martin, hat im Namen von Romanautoren, die glauben, dass ihre Arbeit zum Trainieren des generativen KI-Chatbots verwendet wurde, eine Sammelklage gegen den chatgpt-Hersteller OpenAI eingereicht.
Die Klage wird von der Interessenvertretung The Authors Guild organisiert, die in sagte ein Statement dass „generative KI den Autorenberuf zu dezimieren droht“ und dass sie die Klage „wegen der tiefgreifenden Ungerechtigkeit und Gefahr der Verwendung urheberrechtlich geschützter Bücher zur Entwicklung kommerzieller KI-Maschinen ohne Erlaubnis oder Bezahlung“ eingereicht hat.
„Dieser Fall ist lediglich der Anfang unseres Kampfes, Autoren vor Diebstahl durch OpenAI und andere generative KI zu schützen“, sagte Maya Shanbhag Lang, Präsidentin der Authors Guild. „Als älteste und größte Schriftstellerorganisation mit fast 14.000 Mitgliedern ist die Gilde in der einzigartigen Position, die Rechte der Autoren zu vertreten. Unsere Mitglieder sind vielfältig und leidenschaftlich. Unsere Mitarbeiter, darunter ein hervorragendes Anwaltsteam, verfügen über Fachwissen im Urheberrecht. Das.“ Das heißt: Wir ziehen diese Klage nicht auf die leichte Schulter. Wir sind hier, um zu kämpfen.“
Die vollständige Liste der Autoren, die ihre Namen auf den Anzug gesetzt haben, ist: David Baldacci, Mary Bly, Michael Connelly, Sylvia Day, Jonathan Franzen, John Grisham, Elin Hilderbrand, Christina Baker Kline, Maya Shanbhag Lang, Victor LaValle, George RR Martin, Jodi Picoult, Douglas Preston, Roxana Robinson, George Saunders, Scott Turow und Rachel Vail.
Die letzte Woche eingereichte Beschwerde wirft OpenAI ausdrücklich vor, „Text aus Büchern, die von Raubkopien kopiert wurden“, zum Trainieren von GPT 3.5 und GPT 4 zu verwenden.
Wie der Name schon sagt, erfordern „große Sprachmodelle“ wie ChatGPT viele Trainingsdaten, und die Unternehmen dahinter sind nicht dafür bekannt, anspruchsvoll zu sein, was sie aus dem Internet heraussuchen. Anstatt beispielsweise zu vermeiden, Hassreden und anderes beleidigendes Material herauszufiltern, entwickelte OpenAI ein zweites KI-System, um es herauszufiltern.
Laut der Beschwerde reagierte ChatGPT zuvor auf Anfragen, Passagen aus urheberrechtlich geschützten Büchern zu zitieren, mit „einem guten Maß an Genauigkeit“ und lehnte die Aufforderung erst kürzlich ab. In der Klage wird behauptet, dass eine Anfrage nach einer Zusammenfassung eines Buchs mittlerweile häufig „Details enthält, die in Rezensionen und anderem öffentlich zugänglichen Material nicht verfügbar sind“, was darauf hindeutet, dass das Buch selbst weiterhin Teil der Trainingsdaten ist. In der Klage wird außerdem darauf hingewiesen, dass OpenAI zugegeben hat, dass in seinem Schulungsmaterial urheberrechtlich geschützte Werke vorkommen Erklärung gegenüber dem Patent- und Markenamt [PDF].
ChatGPT scheut sich auch nicht davor, echte Autoren nachzuahmen: Ich habe gerade die kostenlose Version dazu aufgefordert, „eine Kurzgeschichte im Stil von George RR Martin“ zu schreiben, und das tat sie, beginnend mit „In den schattigen Hallen von Castle Blackthorn“. , ein bitterer Wind heulte durch die Zinnen und trug die Verheißung des unerbittlichen Griffs des Winters mit sich.“ (Ich liebe die Verwendung von „Zinnungen“.)
Die Autorengilde weist auf einen kürzlichen Versuch hin, „die Bände 6 und 7 der Game of Thrones-Serie „Das Lied von Eis und Feuer“ des Klägers George RR Martin mit der Software von OpenAI zu erstellen. Der Schöpfer dieses Projekts hat habe es von GitHub entferntsagt aber, dass sie erreichbar sind, wenn Martins Vertreter sie kontaktieren möchten.
Die Klage ist voll von anderen spezifischen KI-Nachahmungsvorwürfen im Zusammenhang mit der Arbeit jedes einzelnen Autors, aber die öffentliche Stellungnahme von The Authors Guild konzentriert sich auf das Gesamtbild und bezeichnet die unbefugte Verwendung fiktionaler Texte für KI-Trainingsmaterial als „Identitätsdiebstahl im großen Stil“.
„Großartige Bücher werden im Allgemeinen von denen geschrieben, die ihre Karriere und sogar ihr Leben damit verbringen, ihr Handwerk zu erlernen und zu perfektionieren“, sagte Mary Rasenberger, CEO der Authors Guild. „Um unsere Literatur zu bewahren, müssen Autoren die Möglichkeit haben zu kontrollieren, ob und wie ihre Werke von generativer KI verwendet werden. Die verschiedenen GPT-Modelle und andere aktuelle generative KI-Maschinen können nur Material generieren, das von dem abgeleitet ist, was davor war. Sie kopieren Sätze.“ Struktur, Stimme, Geschichtenerzählen und Kontext aus Büchern und anderen aufgenommenen Texten. Die Ergebnisse sind bloße Remixe ohne Hinzufügung einer menschlichen Stimme. Hochgewürgte Kultur ist kein Ersatz für menschliche Kunst.“
Die Autoren fordern als Gruppe nicht einen Stopp der gesamten Entwicklung großer Sprachmodelle, sondern sagen, dass die Arbeit eines Autors nur mit Genehmigung und Vergütung für das KI-Training verwendet werden sollte.
„Autoren sollten das Recht haben zu entscheiden, wann ihre Werke zum ‚Training‘ von KI verwendet werden“, sagte der Schriftsteller Jonathan Franzen. „Wenn sie sich dafür entscheiden, mitzumachen, sollten sie angemessen entschädigt werden.“
Ein Gaming-Unternehmen, das einen solchen Ansatz verfolgt, ist Hidden Door, das die fiktiven Welten und Schreibstile von Autoren lizenzieren und daraus Multiplayer-RPG-Abenteuer mit einem selbst entwickelten KI-System generieren will. Das erste Spiel des Unternehmens basiert auf einem gemeinfreien Werk, „Der Zauberer von Oz“.
„Ich weiß, dass das umstritten ist, aber ich glaube nicht, dass KI von Natur aus böse ist“, sagte Hilary Mason, CEO von Hidden Door, Anfang des Jahres gegenüber PC Gamer. „Ich denke, wir streiten darüber, wer davon profitiert, und wir wollen wirklich, dass die Autoren, die Schöpfer, davon profitieren. Und deshalb machen wir das so, wie wir es machen.“
Die Authors Guild hat google zuvor wegen des Buchscannens für die Google Buchsuche verklagt Am Ende hat Google gewonnen in einer Entscheidung, die zur Entwicklung der digitalen Buchausleihe durch Bibliotheken führte.
Ich habe OpenAI um einen Kommentar zu der Klage gebeten, insbesondere zu der Behauptung, dass es Raubkopien von Romanen als GPT-Schulungsmaterial verwendet habe, und werde diesen Artikel aktualisieren, wenn ich etwas höre.