Berichten zufolge nutzte OpenAI YouTube-Daten, um seine KI-Modelle zu trainieren, was möglicherweise einen Verstoß gegen die Nutzungsbedingungen darstellt. Obwohl YouTube eine große Menge an Inhalten anbietet, ist es verboten, seine Daten für andere Zwecke als den persönlichen oder nicht kommerziellen Gebrauch zu verwenden. Elon Musk warf Microsoft zuvor vor, Twitter-Daten illegal für das KI-Training zu nutzen.
Der ChatGPT-Hersteller OpenAI hat Berichten zufolge die Daten von YouTube verschrottet, um seine Modelle für künstliche Intelligenz zu trainieren. Tech-Outlet google-an-edge-in-ai“ target=“_blank“ rel=“noopener“>Die Information zitierte eine anonyme Quelle und berichtete, dass das von Microsoft unterstützte KI-Labor heimlich Daten von der Website verwendet habe [YouTube] einige seiner KI-Modelle zu trainieren.
Das zu Google gehörende YouTube ist die weltweit größte Videobibliothek und damit eine reichhaltige Quelle für Bilder, Texttranskripte und Audio. Die Nutzungsbedingungen der Plattform erlauben jedoch keine Nutzung der Inhalte für andere als den persönlichen oder nicht kommerziellen Gebrauch.
Modelle der künstlichen Intelligenz benötigen für das Training Unmengen an Daten, und AI Labs haben das Internet abgeschafft, um diesen Bedarf zu decken, und dabei manchmal auch auf urheberrechtlich geschützte Medien zurückgegriffen. Dieser Ansatz hat eine Debatte und Klagen wegen Verletzung des Urheberrechts von Künstlern ausgelöst. Selbst große Sprachmodelle aus namhaften KI-Laboren sind hinsichtlich des Inhalts ihrer Trainingsdaten nicht sehr transparent.
Anfang des Jahres behauptete Elon Musk, dass Microsoft die Daten von Twitter zum Trainieren von KI verwendet habe, und drohte dem Software-Major mit einer möglichen Klage. „Sie haben illegal mit Twitter-Daten trainiert. Es ist Zeit für eine Klage“, sagte Musk in einem Tweet als Reaktion auf die Nachricht, dass Microsoft Twitter von seinen Werbeplattformen streichen würde.
Sie trainierten illegal mit Twitter-Daten. Klagezeit.
— Elon Musk (@elonmusk) 19. April 2023
Das neueste GPT-4-Sprachmodell von OpenAI unterstützt die Bing AI-Plattform von Microsoft sowie den kostenpflichtigen Chatbot ChatGPT Plus von OpenAI. Der Bing Image Creator von Microsoft verwendet DALL-E von OpenAI, um Benutzern das Erstellen von Bildern aus Texteingabeaufforderungen zu ermöglichen. Google hat kürzlich sein neues und leistungsstärkstes Sprachmodell PaLM 2 vorgestellt, das inzwischen Dutzende seiner Produkte und Dienste unterstützt.
Die Information berichtete außerdem, dass Google eine Fortsetzung seines maschinellen Lernmodells entwickelt, das seinen Konversations-Chatbot Bard antreibt. Das Unternehmen nutzt YouTube, um sein nächstes großes Sprachmodell zu entwickeln: Gemini.