Start ChatGPT Große Zeitungen wollen von OpenAI eine Bezahlung für Geschichten, die ChatGPT unterstützen
Große Zeitungen wollen von OpenAI eine Bezahlung für Geschichten, die ChatGPT unterstützen

Große Zeitungen wollen von OpenAI eine Bezahlung für Geschichten, die ChatGPT unterstützen

[ad_1]

Eine Handvoll großer Zeitungen verhandeln mit OpenAI, dem Hersteller von chatgpt, über den Zugang zu einer lebenswichtigen Ressource im Zeitalter der generativen künstlichen Intelligenz: digitalen Nachrichten.

Seit Jahren nutzen Technologieunternehmen wie Open AI Nachrichtenmeldungen frei, um Datensätze zu erstellenBringen Sie ihren Maschinen bei, menschliche Fragen zur Welt zu erkennen und fließend darauf zu reagieren. Doch da das Streben nach der Entwicklung hochmoderner KI-Modelle immer hektischer wird, sind die Zeitungsverleger immer hektischer gewordenund andere Dateneigentümer fordern einen Anteil am potenziell riesigen Markt für generative KI, der laut Bloomberg Intelligence bis 2032 voraussichtlich 1,3 Billionen US-Dollar erreichen wird.

Zumindest seit August 535 Nachrichtenorganisationen – darunter die New York Times, Reuters und The Washington Post – haben einen Blocker installiert, der verhindert, dass ihre Inhalte gesammelt und zum Trainieren von ChatGPT verwendet werden. Jetzt konzentrieren sich die Diskussionen darauf, Verlage zu bezahlen, damit der Chatbot in seinen Antworten Links zu einzelnen Nachrichtenmeldungen einblenden kann, eine Entwicklung, die den Zeitungen in zweierlei Hinsicht zugute kommen würde: durch die Bereitstellung direkter Zahlungen und durch potenziell höhere Zugriffe auf ihre Websites.

Im Juli schloss Open AI einen Vertrag zur Lizenzierung von Inhalten der Associated Press als Trainingsdaten für seine KI-Modelle ab.Laut zwei mit den Gesprächen vertrauten Personen, die unter der Bedingung der Anonymität sprachen, um sensible Themen zu besprechen, wurde dieser Gedanke auch in den aktuellen Gesprächen thematisierthaben sich mehr darauf konzentriert, Geschichten in ChatGPT-Antworten anzuzeigen.

Andere Quellen nützlicher Daten suchen ebenfalls nach Hebelwirkung. Laut einer mit der Angelegenheit vertrauten Person hat sich Reddit, das beliebte Social-Message-Board, mit Top-Unternehmen im Bereich der generativen KI über die Bezahlung seiner Daten getroffen und dabei unter der Bedingung der Anonymität über private Verhandlungen gesprochen.Sollte es nicht zu einer Einigung kommen, erwägt Reddit, seine Inhalte erstmals hinter einer Login-Seite zu platzieren.

Dies würde verhindern, dass das Forum in der google-Suche entdeckt wird, was zu einer Verringerung der Besucherzahlen auf der Website führen würde. Aber das Unternehmen glaubt, dass sich der Kompromiss lohnen würde, sagte die Person und fügte hinzu:„Reddit kann ohne Suche überleben.“

Siehe auch  Der Wert von ChatGPT-Eigentümer OpenAI steigt inmitten des KI-Goldrauschs sprunghaft an und wird nach dem Verkauf der bestehenden Anteile auf 90 Milliarden US-Dollar geschätzt

Und im April begann Elon Musk, 42.000 US-Dollar für den Massenzugriff auf Beiträge auf Twitter zu verlangen – der zuvor für Forscher kostenlos gewesen war –, nachdem er behauptet hatte, dass KI-Unternehmen die Daten illegal zum Trainieren ihrer Modelle verwendet hätten. (Musk hat Twitter seitdem in X umbenannt.)

Die Schritte zeugen von einem wachsenden Gefühl der Dringlichkeit und Unsicherheit darüber, wer von Online-Informationen profitiert. Da die generative KI die Art und Weise, wie Benutzer mit dem Internet interagieren, verändern wird, sehen viele Verlage und andere Unternehmen eine faire Bezahlung ihrer Daten als existenzielles Problem an.

Einen Monat nach dem Start von GPT-4 durch OpenAI im März ging beispielsweise der Datenverkehr zur Coding-Community Stack Overflow um 15 Prozent zurück, da sich Programmierer für Antworten auf ihre Codierungsfragen an KI wandten, so CEO Prashanth Chandrasekar, der seiner Meinung nach auch gegenüber The Post sagte Die KI war auf den Daten von Stack Overflow trainiert worden.

Diese Woche hat das Unternehmen 28 Prozent seiner Mitarbeiter entlassen.

Zusätzlich zu den Zahlungsaufforderungen sehen sich führende KI-Unternehmen mit einer Reihe von Urheberrechtsklagen einzelner Buchautoren, Künstler und Softwareentwickler konfrontiert, die Schadensersatz wegen Rechtsverletzung sowie eine Gewinnbeteiligung fordern.Am späten Mittwoch beteiligte sich der frühere Gouverneur von Arkansas, Mike Huckabee, als Kläger an einer Sammelklage gegen Meta, Microsoft und Bloomberg wegen der Verwendung von KI-Tools mit Raubkopien zum Trainieren von KI-Systemen, wie Reuters berichtete. Unterdessen drängen Handelsgruppen den Gesetzgeber auf das Recht auf TarifverhandlungenTechnologieunternehmen.

Die Verhandlungsentscheidung von Open AI spiegelt möglicherweise den Wunsch wider, Vereinbarungen zu treffen, bevor Gerichte die Möglichkeit haben, darüber abzuwägen, ob Technologieunternehmen eine klare rechtliche Verpflichtung haben, Inhalte zu lizenzieren und dafür zu bezahlen, sagte James Grimmelmann, Professor für Digital- und Informationsrecht an der Cornell Universität, die kürzlich bei der Organisation eines Workshops zu generativer KI und Recht auf der International Conference on Machine Learning mitgewirkt hat.

Ein OpenAI-Sprecher bestätigte, dass das Unternehmen Gespräche mit den Zeitungen führt und dass sich die Diskussionen nicht auf frühere Trainingsdaten konzentrierten, die seiner Meinung nach auf legale Weise erlangt wurden. „Keine der Praktiken des Unternehmens hat gegen das Urheberrecht verstoßen“, sagte der Sprecher. „Jede Vereinbarung würde sich auf den künftigen Zugriff auf Inhalte beziehen, die ansonsten unzugänglich wären, oder auf die Anzeige von Nutzungen, die über die faire Nutzung hinausgehen.“

Siehe auch  Die Auswirkungen von ChatGPT auf Schulen

Laut dem Analyseunternehmen PitchBook flossen in den ersten drei Quartalen des Jahres 2023 fast 16 Milliarden US-Dollar an Risikokapital in generative KI – eine Geldflut, die teilweise widerspiegelt, wie teuer die Entwicklung der Technologie ist. Jede Komponente ist unerschwinglich teuer oder schwer zu erwerben, von der Hardware bis zur Rechenleistung.

Bisher waren die Daten der einzige kostenlose und einfache Teil. Weit verbreitete Dienste wie die gemeinnützige Non-Profit-Organisation Common Crawl berechnen Google, Meta, OpenAI und anderen keine Gebühren für die Nutzung ihres Dienstes, der das Internet auf der Suche nach Online-Textbeständen durchsucht und die Informationen archiviert, damit andere sie herunterladen können.Um die riesigen Mengen an natürlicher Sprache und Fachinformationen zusammenzustellen, die zum Trainieren großer KI-Systeme erforderlich sind, haben Technologieunternehmen diese Archive mit Online-Datensätzen kombiniert, auf Informationen zugegriffen, die für Forschungszwecke zur Verfügung gestellt wurden, und weichen zunehmend von Informationen ab eindeutig gemeinfrei.

Bis vor Kurzem waren Technologieunternehmen abgeneigt, für diese Daten zu zahlen. An einer Hörsitzung Sy Damle, ein Anwalt der Risikokapitalgesellschaft Andreessen Horowitz aus dem Silicon Valley, räumte in seiner im April vom US Copyright Office veranstalteten Veranstaltung zur generativen KI ein, dass „diese Tools nur dann praktikabel existieren können, wenn sie auf riesigen Datenmengen trainiert werden können.“ ohne diese Daten lizenzieren zu müssen.“

Noch bevor OpenAI und Google im August und September Tools zum Blockieren ihrer KI-Datencrawler veröffentlichten, begannen große Online-Foren wie Reddit, Stack Overflow und Wikipedia mit Abwehrmaßnahmen. Die Websites, die seit langem regelmäßig „Datendumps“ bereitstellen, die Inhalte für das KI-Training leicht verfügbar machen, entwickeln oder haben jetzt kostenpflichtige Portale für KI-Unternehmen auf der Suche nach Trainingsdaten entwickelt und überwachen streng die Grenzen, wie oft ihre Website nach Daten durchsucht werden kann.

Während Reddit, Stack Overflow und Nachrichtenorganisationen das einläuten, was er nannteNicholas Vincent, Informatikprofessor an der Simon Fraser University in British Columbia, läutete eine neue Ära der „Datenstreiks“ ein und warnte davor, dass Verlage Stärke in Zahlen finden müssen: KI-Betreiber „kümmern sich niemals darum, dass eine Person geht“, sagte er sagte.

Siehe auch  ChatGPT beherrscht 20 % der spanischen Sprache nicht und der Rest versteht es falsch

Robert Thomson, Vorstandsvorsitzender von NewsCorp, wiederholte dieses Verständnis auf einer Medienkonferenz im Mai, als er gefragt wurde, ob er einen Deal mit den großen digitalen Playern bekannt geben möchte. „Das wünschte ich“, sagte Thomson. „Aber es können nicht nur wir sein.“

Seitdem hat das Medienkonglomerat IAC, dem The Daily Beast gehört, versucht, eine Koalition von Verlagen aufzubauen, die darauf abzielten, durch eine Klage oder gesetzgeberische Maßnahmen Milliarden von Dollar von KI-Unternehmen zu gewinnen, heißt es in einem Bericht vom Juli Ampeln. Im August, NPR berichtete, dass die New York Times ebenfalls eine Klage gegen OpenAI erwäge.

Im aktuellen Klima sind die Dateninhaber, die am besten für einen Deal geeignet sind, immer noch Unternehmen, die es gewohnt sind, ihre geistigen Eigentumsrechte geltend zu machen, und nicht einzelne Künstler, Autoren und Programmierer, sagte Yacine Jernite, die das Team für maschinelles Lernen und Gesellschaft bei Hugging Face leitet Open-Source-KI-Startup.

Beispielsweise hat die Stockfoto-Website Shutterstock eine Partnerschaft zur Bereitstellung von Trainingsdaten für OpenAI. Ende letzten Jahres hat das Unternehmen außerdem einen Beitragsfonds ins Leben gerufen, um Künstler zu entschädigen, deren Arbeit zum Trainieren von KI-Modellen verwendet wurde. Eine Analyse eines Stockfotografen Robert Kneschke Schätzungen zufolge hat der Fonds im Mai mehr als 4 Millionen US-Dollar ausgezahlt – die durchschnittliche Auszahlung betrug jedoch nur 0,0069 US-Dollar pro Bild. Shutterstock reagierte nicht auf die Bitte um Stellungnahme.

Danielle Coffey, Präsidentin und CEO der News/Media Alliance (NMA), einer Handelsgruppe, die mehr als 2.000 Verlage vertritt, sagte, das Weiße Haus und andere politische Entscheidungsträger seien der Notwendigkeit von Lizenzvereinbarungen gegenüber aufgeschlossen gewesen. Sie organisierte kürzlich eine Woche Besuche in Washington und verschiedenen Landeshauptstädten, um sich für den Urheberrechtsschutz für Verlage einzusetzen.

Bei der generativen KI „muss das, was reinkommt, auch raus“, sagte Coffee. „Wenn qualitativ hochwertige Inhalte und Qualitätsjournalismus nicht dazu gehören, ist das weder für die Produkte selbst noch für die Gesellschaft gut.“

[ad_2]

5/5 - (183 votes)
Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein