Berichten zufolge hat OpenAI mehr als eine Million Stunden YouTube-Videos transkribiert, um GPT-4 zu trainieren Die New York Times am Samstag. Der Bericht kommt nur wenige Tage, nachdem YouTube-CEO Neal Mohan die Transkription sagte YouTube-Videos zum KI-Training wäre ein „klarer Verstoß” seiner Richtlinien in einem Bloomberg-Interview.

„Wenn ein YouTuber seine harte Arbeit auf unsere Plattform hochlädt, hat er bestimmte Erwartungen. Eine dieser Erwartungen besteht darin, dass die Nutzungsbedingungen eingehalten werden“, sagte Mohan in einem Interview mit Bloomberg letzte Woche. „Das Herunterladen von Dingen wie Transkripten oder Videoausschnitten ist jedoch nicht möglich.“

In dem Bericht der New York Times wird Quellen zufolge behauptet, dass Mitglieder des OpenAI-Teams, darunter Präsident Greg Brockman, persönlich beim Sammeln der YouTube-Videos geholfen hätten. Der Artikel beschreibt, wie OpenAI und viele Technologieunternehmen Schwierigkeiten haben, genügend Daten zu sammeln, um riesige KI-Modelle zu trainieren. OpenAI nutzte angeblich Whisper, seine KI-Transkriptionssoftware, um mehr Daten zu sammeln, um GPT-4 zu trainieren, das neueste und beste Modell, das chatgpt zugrunde liegt.

OpenAI und google reagierten nicht sofort auf die Bitte von Gizmodo um einen Kommentar.

Der Bericht der New York Times könnte massive Auswirkungen auf den anhaltenden Kampf von OpenAI und Google an der Spitze der generativen KI-Entwicklung haben. Es ist unwahrscheinlich, dass Google stillschweigend reagiert, wenn OpenAI seine Inhalte nutzt, um ChatGPT noch besser zu machen. Allerdings hat das Unternehmen bisher keine derartigen Vorwürfe erhoben. In einer Stellungnahme dazu Der Rand An diesem Wochenende sagte ein Google-Sprecher lediglich, er habe „unbestätigte Berichte“ über das Training von OpenAI gesehen.

Siehe auch  Der Star-Wars-Konzeptkünstler Colin Cantwell stirbt im Alter von 90 Jahren

YouTubes Nutzungsbedingungen jedem Benutzer das Herunterladen seiner Inhalte verbieten, einschließlich der Verwendung von Botnetzen oder Scrapern, es sei denn, er verfügt über eine eindeutige Genehmigung des Unternehmens. YouTube verbietet außerdem die Nutzung seiner Inhalte für jegliche „unabhängige“ Nutzung seines Dienstes.

Mira Murati, Chief Technology Officer von OpenAI, sagte: „nicht sicher” ob YouTube-Videos verwendet wurden, um das Text-zu-Video-KI-Modell ihres Unternehmens zu trainieren Sora auf Nachfrage von Das Wall Street Journal März. Der Bericht der New York Times erwähnt nichts über Sora oder tatsächliche YouTube-Teile selbst. Ihr Zögern, diese Frage direkt zu beantworten, führt jedoch zu größeren Spekulationen.

Die New York Times selbst ist dabei ein Urheberrechtsstreit mit OpenAI im Augenblick. OpenAI und Meta werden auch von einer Reihe von Autoren und Content-Häusern verklagt, weil sie ihre KI auf urheberrechtlich geschützte Werke trainiert haben.

Sollten diese Berichte wahr sein, könnte dies völlig neue Fragen zum Urheberrecht in der KI-Welt aufwerfen. Die meisten Urheberrechtsbeschwerden im Zusammenhang mit KI wurden von kleinen Verlagen eingereicht, aber Google könnte diesem Kampf echtes Gewicht verleihen, wenn es sich dazu entschließt, sich zu beteiligen. Es wäre auch eine Möglichkeit für Google, OpenAI zu verlangsamen, das derzeit zweifellos das KI-Rennen gewinnt.

Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein