Als Reaktion auf die Klage, die die New York Times gegen sie eingereicht hat, hat OpenAI versucht, Teile der Beschwerde abzuweisen.chatgpt-do-they-want-to-win-or-influence-public-opin.html#_ftn1″ name=“_ftnref1″>[1] Doch anstatt einen herkömmlichen Antrag auf Abweisung einzureichen, in dem argumentiert wird, dass die Behauptungen der Beschwerde nicht ausreichen, um eine rechtliche Haftung zu begründen, ging OpenAI in die Offensive. Es versuchte, den Fall neu zu formulieren, indem es einen ausführlichen Sachverhalt einbezog, der weit über die in der Beschwerde enthaltenen Behauptungen hinausging und mit diesen teilweise unvereinbar war. Kurz gesagt, der Antrag auf Abweisung scheint eher ein Versuch zu sein, die öffentliche Meinung zum Times-Fall zu beeinflussen, als ein Versuch, den Umfang des Streits einzuschränken.
Am 27. Dezember 2023 reichte die Times ihre Klage gegen Microsoft Corp. ein; OpenAI, Inc.; und verbundene Unternehmen vor dem US-Bezirksgericht für den südlichen Bezirk von New York mit der Begründung, dass diese Unternehmen große Sprachmodelle (LLMs) für die urheberrechtlich geschützten Werke der Times nicht ordnungsgemäß trainiert hätten und dass die Beklagten diese Modelle dann für die öffentliche Nutzung eingesetzt hätten. Die Beschwerde der Times umfasst Fälle von direkter Urheberrechtsverletzung, stellvertretender Urheberrechtsverletzung, mittelbarer Urheberrechtsverletzung, Verstößen gegen den Digital Millennium Copyright Act (DMCA), unlauterem Wettbewerb durch widerrechtliche Aneignung und Markenverwässerung. Als Wir haben es bereits besprochenEin bemerkenswerter Aspekt der Beschwerde ist ihre Spezifität – insbesondere liefert sie mehrere Beispiele dafür, dass das ChatGPT LLM in der Lage ist, Times-Artikel nahezu wörtlich wiederzugeben.
Am 26. Februar 2024 antwortete OpenAI mit einem Antrag auf Abweisung der Ansprüche wegen mittelbarer Urheberrechtsverletzung (Anspruch IV), DMCA-Verstößen (Anspruch V) und unlauterem Wettbewerb (Anspruch VI). OpenAI möchte außerdem erreichen, dass Teile der Ansprüche wegen direkter und mittelbarer Urheberrechtsverletzungen, die außerhalb der Verjährungsfrist entstanden sind, als verjährt abgewiesen werden.
Der Antrag von OpenAI auf Abweisung ist aus mehreren Gründen bemerkenswert. Anträge auf Abweisung folgen im Allgemeinen einem altbewährten Weg, indem sie die sachlichen Feststellungen der Beschwerde vortragen und dann argumentieren, dass diese Tatsachen, selbst unter den besten Umständen für den Kläger, nicht die Grundlage für einen einklagbaren Anspruch bilden. Der Grund dafür ist, dass das Gericht bei der Prüfung eines Antrags auf Abweisung davon ausgeht, dass alle Tatsachen in einer gut dargelegten Beschwerde wahr sind und alle vernünftigen Schlussfolgerungen aus diesen Tatsachen gezogen werden. Das Gericht wird die Klage (oder Teile davon) dann nur dann abweisen, wenn diese Tatsachen keine plausible Grundlage für die geltend gemachten Ansprüche bilden oder wenn eine rechtliche Beschränkung der Ansprüche offensichtlich ist, ohne dass eine Tatsachenfeststellung vorliegt. OpenAI hat diesen Ansatz nicht gewählt.
Stattdessen ging OpenAI sachlich weit daneben und beschränkte sich nicht auf die sachlichen Feststellungen der Beschwerde. Um dies zu erreichen, ohne den Zorn des Richters auf sich zu ziehen, versuchte es, sich auf mehrere der Lücken zu berufen, die die Berücksichtigung von Informationen außerhalb der ausdrücklichen Formulierung einer Beschwerde ermöglichen, und dehnte die Ausnahmen aus, bis sie die Grundregeln für Anträge auf Abweisung verschluckten. Letzten Endes könnte also der Abschnitt zum sachlichen Hintergrund des Antrags selbst den Zorn des Richters auf sich ziehen, weil dieser offensichtlich versucht hat, die Grundregeln von Anträgen auf Abweisung zu umgehen.
Tatsächlich liest sich der Abschnitt zum sachlichen Hintergrund des Antrags auf Abweisung eher wie eine Pressemitteilung als wie ein juristisches Plädoyer, da er neue Tatsachenbehauptungen vorstellt, argumentiert, dass die in der Beschwerde behaupteten Tatsachen falsch sind, positive Verteidigungen vorschlägt und eine überzogene Selbstdarstellung enthält. Beurteilung der Bedeutung des Unternehmens dienen.[2] Aber OpenAI gibt die grundlegendste Prämisse der Beschwerde tatsächlich voll und ganz zu: dass es die Arbeit der Times kopiert und zum Unterrichten des ChatGPT LLM verwendet hat (wenn auch vor mehr als drei Jahren). Diese vierzehnseitige Darstellung der Geschichte von ChatGPT hat dann kaum oder gar keinen Bezug zu den vier inhaltlichen Argumenten, die in der zweiten Hälfte des Antrags vorgebracht wurden.
In seinem ersten inhaltlichen Argument macht OpenAI klar und deutlich geltend, dass jede direkte Urheberrechtsverletzung, die „vor mehr als drei Jahren stattgefunden hat“, abgewiesen werden sollte, da sie gemäß der in 17 USC § 507(b) festgelegten Verjährungsfrist verjährt sei.[3] Allerdings sind drei Jahre nicht unbedingt drei Kalenderjahre; Bundesgerichte folgen der „Entdeckungsregel“, die die Dreijahresfrist beginnt, wenn der Kläger den Verstoß entdeckt oder vernünftigerweise hätte entdecken müssen, und nicht mit dem Datum des tatsächlichen Verstoßes. Es ist wahrscheinlich, dass die Times antworten wird, dass sie nichts von der Verletzung durch OpenAI wusste – und vernünftigerweise auch nicht wissen konnte –, bis sie ChatGPT befragen konnte.
OpenAI gibt an, dass die Urheberrechtsverletzungsposition der Times darauf beruht, dass OpenAI die WebText-Datenbank – die Werke der Times enthält – verwendet, um eine frühe Version von GPT (das LLM, das ChatGPT zugrunde liegt) zu trainieren, und dass dieses Training mehr als drei Jahre lang stattgefunden hat vor. Dabei handelt es sich tatsächlich eher um ein Modell der widerrechtlichen Aneignung als um eine Urheberrechtsverletzung; Offensichtlich hat OpenAI eine Kopie der Artikel der Times erstellt, als es sie zum ersten Mal kopierte, aber es wird dies wohl auch weiterhin tun, wenn es ein abgeleitetes Werk auf der Grundlage dieser Artikel erstellt. Darüber hinaus geht OpenAI kaum darauf ein, warum es offenbar davon ausgeht, dass die Times von diesen Aktivitäten wusste oder hätte wissen müssen. Darüber hinaus geht OpenAI in der Beschwerde nicht ausdrücklich auf eine entsprechende Behauptung ein, die sich auf eine andere Datenbank mit Werken der Times bezieht, die zum Trainieren von GPT verwendet wurde: Common Crawl.[4]
Unabhängig davon, wann OpenAI mit der Nutzung einer dieser Datenbanken begonnen hat, ist es verständlich, dass neuere Versionen von GPT wahrscheinlich auf denselben oder ähnlichen Quellen trainiert und erneut trainiert wurden. Wie impliziert von OpenAIs eigene Website, könnte eine weitere Aufnahme der Werke der Times während einiger oder aller Schulungsverfahren erfolgt sein, die zu zahlreichen Iterationen von ChatGPT geführt haben. Tatsächlich identifiziert OpenAI seine Trainingsdatenquellen oder Trainingsverfahren nicht mehr öffentlich. Daher ist es schwer zu verstehen, wie die Times vernünftigerweise von all diesen möglichen Kopierereignissen wissen sollte. Und noch grundlegender: OpenAI gibt dem Gericht keine Anleitung, wie es den Fall eingrenzen und die verjährte ursprüngliche Verletzung und die uneingeschränkte Schaffung abgeleiteter Werke auf einfache Weise auseinanderhalten kann.
Zweitens argumentiert OpenAI, dass die Times keinen Anspruch auf mittelbare Urheberrechtsverletzung geltend gemacht habe. Ein solcher Anspruch setzt voraus, dass der Kläger behauptet, dass der Beklagte von der Urheberrechtsverletzung eines anderen wusste oder wissen musste und dass der Beklagte diese Verletzung tatsächlich wissentlich herbeigeführt, verursacht oder wesentlich dazu beigetragen hat. In der Beschwerde behauptete die Times Folgendes:
Die Beklagten wussten von der direkten Rechtsverletzung durch Endbenutzer oder hatten Grund zu der Annahme, dass die Beklagten umfangreiche Anstrengungen bei der Entwicklung, Prüfung und Fehlerbehebung ihrer LLM-Modelle und GPT-basierten Produkte unternehmen. Den Beklagten ist völlig bewusst, dass ihre GPT-basierten Produkte in der Lage sind, nicht lizenzierte Kopien oder Derivate urheberrechtlich geschützter Times-Werke zu verbreiten.
Hier macht OpenAI zwei Punkte. Der erste ist, dass die Behauptungen der Times zu allgemein sind und nur die bloße Möglichkeit eines Verstoßes durch die Endbenutzer von OpenAI in Betracht ziehen. Das heißt, es gibt keinen konkreten direkten Rechtsverletzer des Endbenutzers, an den der Anreiz von OpenAI gebunden werden kann. Natürlich lägen Informationen über die Eingabeaufforderungen der Endbenutzer und das zurückgegebene Ergebnis in den Händen von OpenAI (falls überhaupt jemand) und nicht in den Händen der Times. Der zweite Punkt, der eher fadenscheinig ist, ist, dass jede solche mittelbare Verletzung gegen die Nutzungsbedingungen von OpenAI verstoßen würde. Das ist ein merkwürdiges Argument, denn es bestreitet nicht, dass es möglicherweise gegen das Gesetz verstoßen hat, sondern nur, dass Endnutzer möglicherweise ihre vertraglichen Verpflichtungen gegenüber OpenAI verletzt haben, wenn sie dem Beispiel von OpenAI folgen. In dem Maße, in dem OpenAI behauptet, dass es lediglich die Tür offengehalten hat und seine Endbenutzer aus eigenem Antrieb hindurchgegangen sind, dürfte ein solcher Standpunkt kaum überzeugend sein.
Drittens behauptete die Times bei der Feststellung eines DMCA-Verstoßes, dass ChatGPT „eine oder mehrere Formen von Informationen zur Urheberrechtsverwaltung in jedem der verletzten Werke der Times entfernt habe, darunter: Urheberrechtsvermerk, Titel und andere identifizierende Informationen, Nutzungsbedingungen“. und identifizierende Nummern oder Symbole, die sich auf die Informationen zur Urheberrechtsverwaltung beziehen.“ OpenAI antwortet unter anderem mit der Feststellung, dass die Anschuldigungen der Times nicht die spezifischen Informationen zur Urheberrechtsverwaltung enthalten, die in jedem Werk enthalten waren, und daher mit einem zu breiten Pinsel gemalt werden. Hier hat OpenAI einige aktuelle Autorität auf seiner Seite, wie die Richter in parallelen Fällen belegen Andersen gegen Stability AI Ltd. Und Tremblay gegen OpenAI, Inc. haben den Anspruch auf ein höheres Maß an Spezifität für analoge LLM-Verletzungsansprüche im Rahmen des DMCA gestellt. Es bleibt abzuwarten, wie die Times versuchen wird, diese Fälle zu unterscheiden.
Was schließlich den unlauteren Wettbewerb durch widerrechtliche Aneignung betrifft, behauptete die Times im Wesentlichen, dass die Nutzung der Inhalte der Times durch OpenAI zu Einnahmeverlusten für die Times führe. Das in der Beschwerde ausführlicher vorgebrachte Argument basiert auf der Sorge der Times, dass die Integration von GPT in eine Suchmaschine (hier Bing von Microsoft) die Notwendigkeit für die Leser erübrigen würde, die Times zu abonnieren oder ihre Website zu besuchen. Mit anderen Worten: Anstatt Benutzer auf die Times zu verweisen, generiert die Suchmaschine ein Ergebnis, das Aspekte der Werke der Times enthält, ohne der Times Geld oder Anerkennung zu geben.
Die Antwort von OpenAI ist hier traditioneller als seine anderen Argumente: dass solche staatlichen Rechtsansprüche durch das Urheberrechtsgesetz ausgeschlossen sind. Dieses Argument ist in der Präzedenzfall gut etabliert und stützt sich nur auf rechtliche Argumente (keine sachlichen Informationen) und hat daher eine größere Wahrscheinlichkeit, Erfolg zu haben als die anderen, neuartigeren Argumente. OpenAI befasst sich auch mit einem der spezifischen Beispiele der Beschwerde für eine angebliche Veruntreuung im Zusammenhang mit den Wirecutter-Produktempfehlungen der Times (als Einnahmequelle der Times). Insbesondere vergleicht OpenAI die Wirecutter-Empfehlungen mit Zusammenstellungen von Aktienempfehlungen, bei denen in einem früheren Fall festgestellt wurde, dass es sich nicht um eine Veruntreuung handelt. Zusammenfassend argumentiert OpenAI, dass die Behauptungen den Zweckentfremdungstest nicht bestehen, da die Wirecutter-Empfehlungen von OpenAI nicht als eigene Arbeit verkauft werden und die Times die Empfehlungen nicht durch „Bemühungen ähnlich der Berichterstattung“ erhalten hat. Dieser Teil des Arguments ist weniger wahrscheinlich erfolgreich, da er den Richter dazu zwingen würde, sich mit den tatsächlichen Ähnlichkeiten und Unterschieden zu befassen.
Der Abweisungsantrag von OpenAI scheint eher ein Versuch zu sein, leichtgläubige Reporter zu überzeugen[5] (und im weiteren Sinne die Öffentlichkeit) der Justiz, wenn es so ist. Sie weigert sich, die Charakterisierung der Fakten durch die Times zu akzeptieren und liefert stattdessen ihre eigene Geschichte und Argumente. Diese Behauptungen sind jedoch nicht eng mit den rechtlichen Argumenten von OpenAI verknüpft. Im besten Fall versucht OpenAI dem Richter einen Fahrplan für das zu geben, was er später sehen wird; Im schlimmsten Fall ist es ein zynischer Trick, um Herzen und Köpfe außerhalb des Gerichts zu gewinnen. Die rechtlichen Argumente im Abweisungsantrag sind dagegen eher traditionell formuliert, haben aber unterschiedliche Erfolgsaussichten. Wir werden bald mehr wissen, wenn die Times antwortet.
[1] Microsoft ist nun auch dazu übergegangen, Teile der Beschwerde zurückzuweisen, und zwar mit einem weitaus traditionelleren Ansatz. Wir werden diesen Antrag in einem der nächsten Beiträge prüfen.
[2] Beispielsweise „wurde OpenAI im Jahr 2015 gegründet, um die digitale Intelligenz so voranzutreiben, dass sie der gesamten Menschheit am ehesten zugute kommt“ und „Das neue GPT-3-Modell war mit Abstand das leistungsfähigste Sprachmodell, das jemals geschaffen wurde.“ Obwohl es sich bei der GPT-Familie in der Tat um einen sehr leistungsstarken Satz großer Sprachmodelle handelt, sollte diese Behauptung mit mehr als nur Vorsicht betrachtet werden. Eine Standardantwort seit Jahren von High-Tech-Unternehmen, denen IP-Diebstahl vorgeworfen wird, lautet: „Halten Sie uns nicht auf, Bruder, wir sind innovativ.“ Diese Reaktion erfolgt häufig, wenn diese Unternehmen enorme Gewinne erzielen oder ein Umfeld schaffen, in dem sie dies tun können.
[3] Bemerkenswert ist, dass Microsoft dieses Argument nicht vorbringt.
[4] OpenAI behauptet, dass vor Ablauf der Dreijahresfrist „allgemein bekannt war, dass WebText2 und Common Crawl zahlreiche von der Times veröffentlichte Artikel enthielten“. Diese Behauptung ergibt sich nicht aus der Beschwerde.
[5] Fairerweise muss man sagen, dass nur wenige Reporter gut genug im Gesetz geschult sind, um zwischen dem Standard für ein summarisches Urteil und einer Entlassung zu unterscheiden. Sogar einige Anwälte liegen falsch.
[View source.]