[ad_1]
Die Geschichte bisher: Eine Gruppe von Nachrichtenmedienorganisationen, darunter Die New York Times, Reuters, CNN und die Australian Broadcasting Corporation haben kürzlich den Zugriff von OpenAI auf ihre Inhalte gesperrt. Die Entwicklung erfolgt im Zuge von Berichten, dass die New York Times plant, das Forschungsunternehmen für künstliche Intelligenz (KI) wegen Urheberrechtsverletzungen zu verklagen, was eine erhebliche Eskalation der Spannungen zwischen Medienunternehmen und dem führenden Entwickler generativer Lösungen für künstliche Intelligenz bedeuten würde.
Was macht OpenAI?
Das Unternehmen ist vor allem für die Entwicklung von „chatgpt“ bekannt, einem KI-Konversations-Chatbot. Benutzer können zu fast allem Fragen stellen und ChatGPT antwortet ziemlich genau mit Antworten, Geschichten und Aufsätzen. Es kann Programmierern sogar dabei helfen, Softwarecode zu schreiben. Der Hype um ChatGPT – insbesondere die atemberaubenden Fortschritte auf dem Gebiet der KI, die für seine Entwicklung erforderlich waren – hat OpenAI zu einem 30-Milliarden-Dollar-Unternehmen gemacht.
Was löste die Konfrontation zwischen Nachrichtenagenturen und OpenAI aus?
Softwareprodukte wie ChatGPT basieren auf dem, was KI-Forscher als „große Sprachmodelle“ (LLMs) bezeichnen. Diese Modelle benötigen enorme Informationsmengen, um ihre Systeme zu trainieren. Wenn Chatbots oder digitale Assistenten in der Lage sein sollen, die Fragen zu verstehen, die Menschen ihnen stellen, müssen sie menschliche Sprachmuster studieren. Technologieunternehmen, die an LLMs wie google, Meta oder Open AI arbeiten, machen Geheimnis darüber, welche Art von Trainingsdaten sie verwenden. Es ist jedoch klar, dass im Internet gefundene Online-Inhalte wie Social-Media-Beiträge, Nachrichtenartikel, Wikipedia und E-Books einen erheblichen Teil des Datensatzes ausmachen, der zum Trainieren von ChatGPT und anderen ähnlichen Produkten verwendet wird. Diese Daten werden durch Auslesen aus dem Internet zusammengestellt. Technologieunternehmen verwenden Software namens „Crawler“, um Webseiten zu scannen, Inhalte aufzusaugen und sie in einem Datensatz zusammenzustellen, der zum Trainieren ihrer LLMs verwendet werden kann.
Dagegen haben sich die Nachrichtenagenturen letzte Woche ausgesprochen Die New York Times und andere blockierten einen Webcrawler namens GPT-Bot, mit dem OpenAI Daten durchsuchte. Sie teilten OpenAI mit, dass das Unternehmen ihr veröffentlichtes Material und ihren Journalismus nicht mehr zum Trainieren ihrer Chatbots verwenden könne.
Warum sind Medienunternehmen verärgert?
Auch Suchmaschinen wie Google oder Bing verwenden Webcrawler, um Websites zu indizieren und relevante Ergebnisse anzuzeigen, wenn Nutzer nach Themen suchen. Der einzige Unterschied besteht darin, dass Suchmaschinen eine für beide Seiten vorteilhafte Beziehung darstellen. Google nimmt beispielsweise einen Ausschnitt eines Nachrichtenartikels (eine Überschrift, einen Klappentext und vielleicht ein paar Sätze) und reproduziert ihn, um seine Suchergebnisse nützlich zu machen. Und während Google von diesen Inhalten profitiert, leitet es gleichzeitig einen erheblichen Teil des Nutzerverkehrs auf Nachrichten-Websites.
OpenAI hingegen bietet Nachrichtenunternehmen keinen finanziellen oder sonstigen Nutzen. Es sammelt lediglich öffentlich verfügbare Daten und nutzt sie für unternehmenseigene Zwecke.
„Jeder, der die Arbeit von nutzen möchte Wallstreet Journal „Journalisten, die künstliche Intelligenz trainieren, sollten die Rechte dafür ordnungsgemäß von Dow Jones lizenzieren“, sagte Jason Conti, General Counsel der Dow Jones-Einheit von News Corp., Anfang des Jahres in einer Erklärung.
Es stimmt aber auch, dass einige Nachrichtenagenturen ChatGPT wahrscheinlich als potenziellen Konkurrenten betrachten, der von ihrem Journalismus profitieren wird. Wenn Sie ChatGPT schließlich bitten, den Kaffee und das Essen zu beschreiben, das in den besten Cafés auf Manhattans Upper East Side serviert wird, kommt die Antwort wahrscheinlich aus einer von KI generierten Mischung aus Berichten von Die New York Times‚ stellt das Team vor und rezensiert Rezensionen, die von Publikationen zum Thema Lebensmittel veröffentlicht wurden.
Wie geht es weiter?
Mit Blick auf die Zukunft müssen zwei Schlüsselfragen beantwortet werden. Wurden Ihre Rechte verletzt, wenn Ihre Daten ohne Erlaubnis oder Entschädigung zum Trainieren von ChatGPT verwendet wurden? Und wie viel können Unternehmen wie OpenAI auszahlen, bevor das ganze Unterfangen finanziell undurchführbar wird? Tech-Gurus argumentieren gerne, dass der Wert von Online-Inhalten nur in ihrer Gesamtheit besteht. Mit anderen Worten: ChatGPT könnte ohne die Berichterstattung von CNN immer noch als hochwertiges Produkt existieren. Aber wenn alle Medienpublikationen auf der ganzen Welt den Zugang zu OpenAI verweigern würden, wäre das Endprodukt wahrscheinlich von geringerer Qualität. Und wenn jeder einzelne Ersteller von Online-Inhalten OpenAI ablehnen würde, gäbe es ChatGPT natürlich mit ziemlicher Sicherheit nicht.
Gleichzeitig ist jedoch klar, dass OpenAI der Meinung ist, dass es sich lohnt, für einige Daten zu bezahlen. Letzten Monat unterzeichnete das Unternehmen eine Lizenzvereinbarung mit The Associated Press, die es dem Unternehmen ermöglichen würde, die Archivinhalte der Nachrichtenagentur als Schulungsdatensatz zu nutzen. Aber was passiert, wenn Leute sich weigern, Zahlungen anzunehmen und OpenAI wegen Urheberrechtsverletzung verklagen, wie es eine Gruppe von Romanautoren letztes Jahr getan hat? Die bevorstehenden Rechtsstreitigkeiten werden interessante Auswirkungen auf den Journalismus, das geistige Eigentum und die Zukunft der künstlichen Intelligenz haben.
(Anuj Srivas ist eine freiberufliche Autorin.)
Dies ist ein Premium-Artikel, der ausschließlich unseren Abonnenten zur Verfügung steht. Jeden Monat mehr als 250 solcher Premium-Artikel lesen
Sie haben Ihr kostenloses Artikellimit ausgeschöpft. Bitte unterstützen Sie Qualitätsjournalismus.
Sie haben Ihr kostenloses Artikellimit ausgeschöpft. Bitte unterstützen Sie Qualitätsjournalismus.
Du hast gelesen {{data.cm.views}} aus {{data.cm.maxViews}} kostenlose Artikel.
Dies ist Ihr letzter kostenloser Artikel.
[ad_2]