OpenAI hat eine arbeitsreiche Woche. Unmittelbar nach der Vorstellung seines neuen GPT-4o-Modells hat das Unternehmen gerade einen Deal angekündigt, um Zugriff auf Echtzeitinhalte über die Daten-API von Reddit zu erhalten. Das ist interessant, wenn man bedenkt, dass Reddit Anfang des Jahres einen ähnlichen Deal mit google abgeschlossen hat, dessen Wert auf etwa 60 Millionen US-Dollar geschätzt wurde.
Während in OpenAI keine finanziellen Bedingungen besprochen wurden Blogeintrag Bei der Bekanntgabe der Vereinbarung gibt der Deal Reddit auch die Möglichkeit, „neue KI-gestützte Funktionen für Redditoren und Mods bereitzustellen“. Und der Aktienkurs von Reddit stieg nach der Ankündigung um mehr als 10 %.
Der letzte Teil des Vertrags sieht vor, dass OpenAI Reddit-Werbepartner wird.
Obwohl keines der beiden Unternehmen erwähnte, welche Rolle Trainingsdaten bei dem Deal spielen, ist es kaum vorstellbar, dass OpenAI den Schatz an Reddit-Inhalten nutzt, um ChatGPT noch mehr Kontext für die Bearbeitung von Anfragen und Anfragen von Benutzern zu geben. Die Verwendung von Reddit-Beiträgen für Trainingsdaten wurde im Google-Deal ausdrücklich erwähnt; Die Enthüllung würde Mountain View „effizientere Möglichkeiten zum Trainieren von Modellen“ bieten.
Natürlich hat Reddit seine Schattenseiten, wenn wir über seine Eignung als Datensatz diskutieren. Im Gegensatz zu Literatur oder regulierten Veröffentlichungen sind Grammatik und Umgangssprache viel lockerer, Insider-Witze und Memes sind weit verbreitet und es gibt dort auch viele Informationen, die einfach falsch sind.
„Reddit hat sich zu einem der größten offenen Archive authentischer, relevanter und immer aktueller menschlicher Gespräche über alles und jedes im Internet entwickelt“, sagte Steve Huffman, Mitbegründer und CEO. „Die Aufnahme in ChatGPT bestätigt unseren Glauben an eine vernetzte Welt.“ Internet, hilft Menschen, mehr oder das zu finden, wonach sie suchen, und hilft neuen Zielgruppen, Community auf Reddit zu finden.“
Inhalt vs. KI
Der Deal formalisiert auch die Beziehungen zwischen einem KI-Unternehmen und einem Content-Unternehmen zu einer Zeit, in der sich die beiden Branchen im Streit befinden. Es ist gut dokumentiert, dass mehrere Urheberrechtsinhaber rechtliche Schritte gegen KI-Ersteller eingeleitet haben, weil sie ihre Inhalte ohne Erlaubnis gecrawlt haben.
Es bleibt abzuwarten, wie die eigenen Benutzer von Reddit, die letztes Jahr über 7.000 Subreddits ignorierten, um gegen Änderungen an den API-Preisen zu protestieren, darauf reagieren werden, dass ihre Beiträge zum Trainieren von KI verwendet werden.
Aber OpenAI hat in den letzten Monaten auch Verträge mit Verlagen wie der Financial Times und Associated Press abgeschlossen.
Das Unternehmen ist außerdem damit beschäftigt, sein GPT-4o-Modell einzuführen, eine multimodale KI, die schneller ist und Text-, Bild-, Video- und Audioaufforderungen verstehen kann. Es gibt keinen genauen Zeitrahmen dafür, wann Sie es erhalten, aber wenn Sie über Ihr Konto Zugriff auf 4o haben, ist es sowohl in der mobilen App als auch online als kostenloses Upgrade verfügbar.