Auf Reddit gepostete Inhalte werden in chatgpt, Reddit und OpenAI integriert angekündigt am Donnerstag. Die neue Partnerschaft gewährt OpenAI Zugriff auf die Daten-API von Reddit und ermöglicht dem generativen KI-Unternehmen Echtzeitzugriff auf Reddit-Beiträge.

Reddit-Inhalte werden in ChatGPT „und neue Produkte“ integriert, heißt es in Reddits Blogbeitrag. Das Social-Media-Unternehmen behauptet, dass die Partnerschaft „den KI-Tools von OpenAI ermöglichen wird, Reddit-Inhalte besser zu verstehen und zu präsentieren, insbesondere zu aktuellen Themen.“ OpenAI wird auch mit der Werbung auf Reddit beginnen.

Der Deal ähnelt dem, den Reddit im Februar mit google geschlossen hat und der es dem Technologieriesen ermöglicht, „neue Möglichkeiten zur Anzeige von Reddit-Inhalten“ zu schaffen und „effizientere Möglichkeiten zum Trainieren von Modellen“ bereitzustellen, so Reddit sagte zu der Zeit. Weder Reddit noch OpenAI gaben die finanziellen Bedingungen ihrer Partnerschaft bekannt, wohl aber die Partnerschaft von Reddit mit Google angeblich im Wert von 60 Millionen US-Dollar.

Im Rahmen der OpenAI-Partnerschaft erhält Reddit außerdem Zugriff auf die großen Sprachmodelle (LLMs) von OpenAI, um Funktionen für Reddit zu erstellen, einschließlich seiner freiwilligen Moderatoren.

Reddits Vorstoß zur Datenlizenzierung

Die Nachricht kommt etwa ein Jahr, nachdem Reddit einen API-Krieg begonnen hat, indem es begann, Gebühren für den Zugriff auf seine Daten-API zu erheben. Dies führte dazu, dass viele beliebte Reddit-Apps von Drittanbietern geschlossen wurden und es zu massiven Benutzerprotesten kam. Reddit, das bald zu einem börsennotierten Unternehmen werden sollte und noch keine Gewinne erwirtschaftet hatte, sagte, einer der Gründe für die plötzliche Änderung sei, KI-Firmen daran zu hindern, Reddit-Inhalte für die kostenlose Ausbildung ihrer LLMs zu nutzen.

Siehe auch  Ich habe ChatGPT nach Worldcoin gefragt, da Großinvestoren Interesse zeigen

Anfang dieses Monats, Reddit veröffentlicht In einer Richtlinie zu öffentlichen Inhalten heißt es: „Leider sehen wir, dass immer mehr kommerzielle Unternehmen unbefugten Zugriff nutzen oder autorisierten Zugriff missbrauchen, um öffentliche Daten in großen Mengen zu sammeln, einschließlich öffentlicher Reddit-Inhalte. Schlimmer noch: Diese Unternehmen haben den Eindruck, dass sie keine Einschränkungen bei der Nutzung dieser Daten haben.“ , und sie tun dies ohne Rücksicht auf Benutzerrechte oder Privatsphäre und ignorieren angemessene rechtliche, sicherheitsrelevante und Benutzerentfernungsanfragen.

In seinem Blogbeitrag vom Donnerstag sagte Reddit, dass Deals wie OpenAI Teil eines „offenen“ Internets seien. Es fügte hinzu: „Ein Teil der Offenheit bedeutet, dass Reddit-Inhalte für diejenigen zugänglich sein müssen, die menschliches Lernen fördern und nach Möglichkeiten suchen, online Gemeinschaft, Zugehörigkeit und Selbstbestimmung aufzubauen.“

Reddit hat deutlich sein Interesse bekundet, Datenlizenzverträge als Kernbestandteil seines Geschäfts abzuschließen. Der Aufbau von KI-Partnerschaften entfacht einen Diskurs über die Verwendung von nutzergenerierten Inhalten zur Befeuerung von KI-Modellen, ohne dass die Nutzer dafür entschädigt werden und einige möglicherweise nicht in Betracht ziehen, dass ihre Social-Media-Beiträge auf diese Weise genutzt würden. OpenAI und Stack Overflow erlebten Anfang dieses Monats einen Rückschlag bei der Integration von Stack Overflow-Inhalten in ChatGPT. Einige Mitglieder der Benutzergemeinschaft von Stack Overflow reagierten, indem sie ihre eigenen Beiträge sabotierten.

OpenAI steht auch vor der Herausforderung, mit Reddit-Daten zu arbeiten, die, wie ein Großteil des Internets, mit Ungenauigkeiten und unangemessenen Inhalten gefüllt sein können. Einige der größten Gegner der API-Regeländerungen von Reddit waren freiwillige Mods. Einige haben die Plattform seitdem verlassen und nach den Regeländerungen sprach Ars Technica mit langjährigen Reddit-Benutzern, die sich Sorgen über die zukünftige Qualität der Reddit-Inhalte machten.

Siehe auch  ChatGPT kann Augenärzten bei der Diagnose von Patienten überlegen sein

Ungeachtet dessen sind generative KI-Firmen daran interessiert, den Zugang von Reddit zu Echtzeit-Gesprächen verschiedener Personen zu nutzen, die ein nahezu endloses Themenspektrum diskutieren. Und Reddit scheint ebenso daran interessiert zu sein, die Daten aus den Beiträgen seiner Benutzer zu lizenzieren.

Advance Publications, dem die Muttergesellschaft von Ars Technica, Condé Nast, gehört, ist der größte Anteilseigner von Reddit.

Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein