Die Financial Times angekündigt ein Deal mit OpenAI am Montag, um seinen erstklassigen Journalismus für Schulung und Information zu lizenzieren chatgpt-hallucinations-1851443014",{"metric25":1}]]“ href=“https://gizmodo.com/openai-scrutiny-european-union-chatgpt-hallucinations-1851443014″>ChatGPTs Modelle. Es schließt sich Axel Springer und Associated Press an, die ähnliche Deals abgeschlossen haben, wo OpenAI bietet angeblich Millionen an für das Recht zur Nutzung von Inhalten. ChatGPT wurde jedoch auf viele andere Web-Scraping-Inhalte geschult, für die OpenAI nicht bezahlt hat. Warum zahlt OpenAI also für einige Datensätze und nicht für andere?
Die Lizenzverträge von OpenAI scheinen eine klare Botschaft zu senden: Wir werden Ihre Inhalte trotzdem nutzen, also schließen Sie einen Vertrag mit uns ab, sonst bleiben Sie auf der Strecke. Der Hauptvorteil eines Lizenzvertrags scheint in den Antworten von ChatGPT eine herausragende Rolle zu spielen. Einige Verlage möchten möglicherweise auch eine Beziehung zum nächsten großen Informationsvertriebskanal festigen, bevor dieser die Führung übernimmt. Es scheint jedoch, dass OpenAI ohnehin viele Inhalte von Verlagen verwendet.
OpenAI trainiert seine KI-Modelle bereits teilweise auf „öffentlich zugängliche Daten“, so CTO Mira Murati, was absichtlich vage erscheint. Was sind überhaupt öffentlich verfügbare Daten? Der Satz geht davon aus, dass alles, was im Internet kostenlos gelesen werden kann, auch kostenlos in ChatGPT integriert werden kann. Gizmodo ist beispielsweise Teil der „öffentlich verfügbaren Daten“ von OpenAI. Unsere Website wurde zwischengespeichert 34.000 Mal auf GPT-2s WebText Datensatz, der letzte von OpenAI veröffentlichte Datensatz, der zum Trainieren eines KI-Modells verwendet wird.
Gizmodo ist für Leser vor allem aufgrund der Werbung auf dieser Webseite kostenlos. Wenn Leser über ChatGPT auf unsere Inhalte zugreifen können, zerstört das unser Geschäftsmodell. Die New York Times, die im WebText-Datensatz von GPT-2 deutlich häufiger verwendet wird, verklagte OpenAI wegen Urheberrechtsverletzung über genau diese Angelegenheit.
Ein Inhaltslizenzvertrag mit OpenAI scheint für Verlage die einzige Möglichkeit zu sein, im KI-Zeitalter relevant zu bleiben. In einem PressemitteilungLaut John Ridding, CEO der Financial Times Group, wird dieser Deal „die Reichweite“ ihrer Arbeit erweitern und gleichzeitig „frühe Einblicke in die Art und Weise bieten, wie Inhalte durch KI an die Oberfläche gebracht werden“.
„Die Sache mit KI ist, dass es sich nicht wirklich um künstliche Intelligenz handelt“, sagte Matthew Butterick, ein Anwalt, der Sarah Silverman und andere Buchautoren vertritt, die OpenAI verklagen, in einem Interview mit Gizmodo. „Es handelt sich um menschliche Intelligenz, die an einem Ort geerntet und von ihren Schöpfern getrennt wurde. Dieses große Technologieunternehmen versieht sie dann mit einem Preisschild und verkauft sie an jemand anderen.“
Butterick ist Kläger in sechs Urheberrechtsklagen gegen KI-Unternehmen. Er ist außerdem Autor, Programmierer und Designer und sagt, er verstehe, wie KI diese Branchen bedrohen kann. Im Allgemeinen geht es in seinen Fällen um die Behauptung, dass KI gleichzeitig die Arbeit von Urhebern nutzt und gleichzeitig deren Lebensunterhalt gefährdet.
Die Lizenzvereinbarungen von OpenAI sorgten für Aufsehen hinsichtlich der Inhalte, die ChatGPT kostenlos nutzt. Technologieunternehmen haben argumentiert, dass generative KI eine „faire Nutzung“ urheberrechtlich geschützter Werke darstellt, weil sie diese in etwas Neues umwandelt. Die KI-Welt hat auch argumentiert, dass sie ein ähnliches Modell wie die google-Suche verwendet, das urheberrechtlich geschützte Inhalte zwischenspeichert, um ein nützliches Tool zur Informationssuche zu schaffen. Ähnlich wie Google haben KI-Chatbots seit Kurzem damit begonnen, Hyperlinks einzubinden. Letztendlich muss ein Gericht entscheiden, ob generative KI eine „faire Nutzung“ darstellt.
OpenAI reagierte nicht sofort auf die Bitte von Gizmodo um einen Kommentar.
Buchautoren und Verleger sind nicht die einzigen, von denen OpenAI Inhalte zu übernehmen scheint. Die New York Times berichtete kürzlich, dass OpenAI GPT-4 auf mehr trainiert habe eine Million Stunden transkribierte YouTube-Videos. Tage vor der Veröffentlichung des Berichts sagte der CEO von YouTube, dass die Verwendung seiner Videos für KI-Schulungen einen „klaren Verstoß“ gegen seine Richtlinien darstellen würde.
Die Content-Lizenzverträge von OpenAI trüben die Diskussion. Das Unternehmen nutzt Internetinhalte irgendwie kostenlos und bezahlt gleichzeitig andere für ihre Arbeit. Berichten zufolge sind andere Technologieunternehmen wie apple bei der Bezahlung aller ihrer Trainingsdaten proaktiver vorgegangen. Berichten zufolge hat Adobe bezahlt 3 $ pro Minute Video um seinen KI-Videogenerator zu trainieren.
Es ist jedoch unklar, ob auch nur eine einmalige Zahlung für den Erhalt von KI-Trainingsdaten ausreicht. Wir sprechen über ein Tool, das möglicherweise die Medienbranche für Autoren, Audio- und Videoproduzenten und mehr revolutionieren könnte. Der Abschluss eines Vertrags mit OpenAI könnte Ihnen einen guten Platz in den ChatGPT-Ergebnissen garantieren, aber es scheint, als hätte der KI-Chatbot Ihre Inhalte trotzdem verwendet. Zumindest im Moment sind KI-Unternehmen daran interessiert, alles im Internet zu nutzen und später Fragen zur Rechtmäßigkeit des Ganzen zu stellen.
Eine Version dieses Artikels erschien ursprünglich auf Gizmodo.