Auf Reddit gepostete Inhalte werden in chatgpt, Reddit und OpenAI integriert angekündigt am Donnerstag. Die neue Partnerschaft gewährt OpenAI Zugriff auf die Daten-API von Reddit und ermöglicht dem generativen KI-Unternehmen Echtzeitzugriff auf Reddit-Beiträge.
Reddit-Inhalte werden in ChatGPT „und neue Produkte“ integriert, heißt es in Reddits Blogbeitrag. Das Social-Media-Unternehmen behauptet, dass die Partnerschaft „den KI-Tools von OpenAI ermöglichen wird, Reddit-Inhalte besser zu verstehen und zu präsentieren, insbesondere zu aktuellen Themen.“ OpenAI wird auch mit der Werbung auf Reddit beginnen.
Der Deal ähnelt dem, den Reddit im Februar mit google geschlossen hat und der es dem Technologieriesen ermöglicht, „neue Möglichkeiten zur Anzeige von Reddit-Inhalten“ zu schaffen und „effizientere Möglichkeiten zum Trainieren von Modellen“ bereitzustellen, so Reddit sagte zu der Zeit. Weder Reddit noch OpenAI gaben die finanziellen Bedingungen ihrer Partnerschaft bekannt, wohl aber die Partnerschaft von Reddit mit Google angeblich im Wert von 60 Millionen US-Dollar.
Im Rahmen der OpenAI-Partnerschaft erhält Reddit außerdem Zugriff auf die großen Sprachmodelle (LLMs) von OpenAI, um Funktionen für Reddit zu erstellen, einschließlich seiner freiwilligen Moderatoren.
Reddits Vorstoß zur Datenlizenzierung
Die Nachricht kommt etwa ein Jahr, nachdem Reddit einen API-Krieg begonnen hat, indem es begann, Gebühren für den Zugriff auf seine Daten-API zu erheben. Dies führte dazu, dass viele beliebte Reddit-Apps von Drittanbietern geschlossen wurden und es zu massiven Benutzerprotesten kam. Reddit, das bald zu einem börsennotierten Unternehmen werden sollte und noch keine Gewinne erwirtschaftet hatte, sagte, einer der Gründe für die plötzliche Änderung sei, KI-Firmen daran zu hindern, Reddit-Inhalte für die kostenlose Ausbildung ihrer LLMs zu nutzen.
Anfang dieses Monats, Reddit veröffentlicht In einer Richtlinie zu öffentlichen Inhalten heißt es: „Leider sehen wir, dass immer mehr kommerzielle Unternehmen unbefugten Zugriff nutzen oder autorisierten Zugriff missbrauchen, um öffentliche Daten in großen Mengen zu sammeln, einschließlich öffentlicher Reddit-Inhalte. Schlimmer noch: Diese Unternehmen haben den Eindruck, dass sie keine Einschränkungen bei der Nutzung dieser Daten haben.“ , und sie tun dies ohne Rücksicht auf Benutzerrechte oder Privatsphäre und ignorieren angemessene rechtliche, sicherheitsrelevante und Benutzerentfernungsanfragen.
In seinem Blogbeitrag vom Donnerstag sagte Reddit, dass Deals wie OpenAI Teil eines „offenen“ Internets seien. Es fügte hinzu: „Ein Teil der Offenheit bedeutet, dass Reddit-Inhalte für diejenigen zugänglich sein müssen, die menschliches Lernen fördern und nach Möglichkeiten suchen, online Gemeinschaft, Zugehörigkeit und Selbstbestimmung aufzubauen.“
Reddit hat deutlich sein Interesse bekundet, Datenlizenzverträge als Kernbestandteil seines Geschäfts abzuschließen. Der Aufbau von KI-Partnerschaften entfacht einen Diskurs über die Verwendung von nutzergenerierten Inhalten zur Befeuerung von KI-Modellen, ohne dass die Nutzer dafür entschädigt werden und einige möglicherweise nicht in Betracht ziehen, dass ihre Social-Media-Beiträge auf diese Weise genutzt würden. OpenAI und Stack Overflow erlebten Anfang dieses Monats einen Rückschlag bei der Integration von Stack Overflow-Inhalten in ChatGPT. Einige Mitglieder der Benutzergemeinschaft von Stack Overflow reagierten, indem sie ihre eigenen Beiträge sabotierten.
OpenAI steht auch vor der Herausforderung, mit Reddit-Daten zu arbeiten, die, wie ein Großteil des Internets, mit Ungenauigkeiten und unangemessenen Inhalten gefüllt sein können. Einige der größten Gegner der API-Regeländerungen von Reddit waren freiwillige Mods. Einige haben die Plattform seitdem verlassen und nach den Regeländerungen sprach Ars Technica mit langjährigen Reddit-Benutzern, die sich Sorgen über die zukünftige Qualität der Reddit-Inhalte machten.
Ungeachtet dessen sind generative KI-Firmen daran interessiert, den Zugang von Reddit zu Echtzeit-Gesprächen verschiedener Personen zu nutzen, die ein nahezu endloses Themenspektrum diskutieren. Und Reddit scheint ebenso daran interessiert zu sein, die Daten aus den Beiträgen seiner Benutzer zu lizenzieren.
Advance Publications, dem die Muttergesellschaft von Ars Technica, Condé Nast, gehört, ist der größte Anteilseigner von Reddit.