Die Komikerin Sarah Silverman war die erste, die die Hersteller generativer KI-Tools wie chatgpt verklagte, weil sie im Grunde ihr Buch gestohlen hatten, aber das Problem ist viel umfassender.
Auch Autoren wie Stephen King und Margaret Atwood fanden ihre Arbeit im Trainingsset von ChatGPT.
Tausende der weltweit beliebtesten Autoren fanden heraus, dass ihre Arbeit in die Trainingsmodelle generativer KI-Tools wie ChatGPT von OpenAi und LLaMA von Meta, der Muttergesellschaft von Facebook, eingeflossen ist.
Lesen Sie auch:KI-Sensibilitätsschulung erforderlich? Microsoft AI hat die Lebensmittelbank fälschlicherweise als touristisches Highlight eingestuft, das man nicht verpassen darf
Zu den betroffenen Autoren gehören beliebte zeitgenössische Schriftsteller wie Stephen King, Margaret Atwood und Jon Krakauer, wobei mehr als 170.000 Raubkopien von Büchern in Algorithmen eingespeist werden.
Aus Der Wächter:
„Books3 wurde verwendet, um Metas LLaMA zu trainieren, eines von mehreren großen Sprachmodellen – das bekannteste davon ist ChatGPT von OpenAI –, das Inhalte basierend auf in Beispieltexten identifizierten Mustern generieren kann. Der Datensatz wurde auch zum Trainieren von Bloombergs BloombergGPT und EleutherAIs GPT-J verwendet und es ist „wahrscheinlich“, dass er in anderen KI-Modellen verwendet wurde.
Bei den in Books3 enthaltenen Titeln handelt es sich zu etwa einem Drittel um Belletristik und zu zwei Dritteln um Sachbücher, und die meisten wurden innerhalb der letzten zwei Jahrzehnte veröffentlicht. Zu den urheberrechtlich geschützten Werken im Datensatz zählen neben den Schriften von Smith, King, Cusk und Ferrante auch 33 Bücher von Margaret Atwood, mindestens neun von Haruki Murakami, neun von Bell Hooks, sieben von Jonathan Franzen, fünf von Jennifer Egan und fünf von David Grann.
Außerdem sind Bücher von George Saunders, Junot Díaz, Michael Pollan, Rebecca Solnit und Jon Krakauer sowie 102 Pulp-Romane des Scientology-Gründers L. Ron Hubbard und 90 Bücher des Pastors John MacArthur enthalten.
Die Titel umfassen große und kleine Verlage, darunter mehr als 30.000 von Penguin Random House, 14.000 von HarperCollins, 7.000 von Macmillan, 1.800 von Oxford University Press und 600 von Verso.“
Derzeit hat kein Verlag Pläne angekündigt, ein generatives KI-Unternehmen auf der Grundlage dieser Nachricht zu verklagen. Wir werden dies jedoch entsprechend aktualisieren, wenn sich die Situation ändert. Wie bei Silvermans Klage hat OpenAI noch keinen Kommentar abgegeben.
Lesen Sie auch:So beweisen Sie, dass Sie ChatGPT nicht verwendet haben: Ein einfacher Trick, um ChatGPT-Plagiatsvorwürfe zu vermeiden
Hauptbild von Stephanie Lawton