Start ChatGPT Der ChatGPT-Hersteller OpenAI steht vor einer Sammelklage wegen Daten zum Trainieren von...
Der ChatGPT-Hersteller OpenAI steht vor einer Sammelklage wegen Daten zum Trainieren von KI

Der ChatGPT-Hersteller OpenAI steht vor einer Sammelklage wegen Daten zum Trainieren von KI

SAN FRANCISCO – Eine in Kalifornien ansässige Anwaltskanzlei erhebt eine Sammelklage gegen OpenAI und behauptet, dass das Unternehmen für künstliche Intelligenz, das den beliebten Chatbot chatgpt entwickelt hat, massiv gegen OpenAI verstoßen hatUrheberrechte und die Privatsphäre unzähliger Menschen verletzten, als das Unternehmen Daten aus dem Internet nutzte, um seine Technologie zu trainieren.

Die Klage zielt darauf ab, eine neuartige Rechtstheorie zu testen – dass OpenAI die Rechte von Millionen Internetnutzern verletzt hat, als es deren Social-Media-Kommentare, Blog-Beiträge, Wikipedia-Artikel und Familienrezepte nutzte. Clarkson, die Anwaltskanzlei hinter der Klage, hat zuvor umfangreiche Sammelklagen zu Themen eingereicht, die von Datenschutzverletzungen bis hin zu falscher Werbung reichten.

Das Unternehmen möchte „echte Menschen vertreten, deren Informationen gestohlen und kommerziell missbraucht wurden, um diese sehr leistungsstarke Technologie zu entwickeln“, sagte Ryan Clarkson, der geschäftsführende Gesellschafter des Unternehmens.

Der Fall wurde am Mittwochmorgen beim Bundesgericht im nördlichen Bezirk von Kalifornien eingereicht. Ein Sprecher von OpenAI reagierte nicht sofort auf eine Bitte um Stellungnahme.

Die Klage geht auf den Kern einer großen ungelösten Frage ein, die im Zusammenhang mit der Zunahme „generativer“ KI-Tools wie Chatbots und Bildgeneratoren steht. Die Technologie funktioniert, indem sie Milliarden von Wörtern aus dem offenen Internet aufnimmt und lernt, Rückschlüsse zwischen ihnen zu ziehen. Nachdem genügend Daten verbraucht wurden, können die resultierenden „großen Sprachmodelle“ vorhersagen, was als Reaktion auf eine Aufforderung zu sagen ist, und geben ihnen so die Möglichkeit, Gedichte zu schreiben, komplexe Gespräche zu führen und Berufsprüfungen zu bestehen. Aber die Menschen, die diese Milliarden von Wörtern geschrieben haben, haben nie zugestimmt, dass ein Unternehmen wie OpenAI sie zu seinem eigenen Vorteil nutzt.

Siehe auch  Nicht Australien, England oder Pakistan! ChatGPT prognostiziert den zweifachen Weltmeister Indien als Favoriten für die Weltmeisterschaft 2023

In der geheimen Liste von Websites, die KI wie ChatGPT intelligent klingen lassen

„All diese Informationen werden in großem Maßstab erfasst, obwohl sie nie für die Nutzung durch ein großes Sprachmodell gedacht waren“, sagte Clarkson. Er sagte, er hoffe, dass ein Gericht einige Leitlinien dafür einführt, wie KI-Algorithmen trainiert werden und wie Menschen entschädigt werden, wenn ihre Daten verwendet werden.

Das Unternehmen verfügt bereits über eine Gruppe von Klägern und plant, weitere zu rekrutieren, sobald die Klage eingeleitet wurde.

Die Rechtmäßigkeit der Nutzung von Daten aus dem öffentlichen Internet zum Trainieren von Tools, die sich für ihre Entwickler als äußerst lukrativ erweisen könnten, ist noch unklar. Einige KI-Entwickler haben argumentiert, dass die Nutzung von Daten aus dem Internet als „faire Nutzung“ betrachtet werden sollte, ein Konzept im Urheberrecht, das eine Ausnahme schafft, wenn das Material auf „transformative“ Weise verändert wird.

Die Frage der fairen Nutzung sei „ein offenes Thema, das in den kommenden Monaten und Jahren vor Gericht behandelt werden wird“, sagte Katherine Gardner, Anwältin für geistiges Eigentum bei Gunderson Dettmer, einer Kanzlei, die vor allem Start-ups im Technologiebereich vertritt. UPS. Künstler und andere kreative Fachleute, die nachweisen können, dass ihre urheberrechtlich geschützten Werke zum Trainieren der KI-Modelle verwendet wurden, könnten ein Argument gegen die Unternehmen haben, die sie verwenden, aber es sei unwahrscheinlicher, dass Personen, die einfach nur Beiträge auf einer Website posten oder kommentieren, Schadensersatz erhalten könnten, sagte sie genannt.

„Wenn Sie Inhalte auf einer Social-Media-Site oder einer anderen Site veröffentlichen, erteilen Sie der Site im Allgemeinen eine sehr weitreichende Lizenz, Ihre Inhalte in irgendeiner Weise nutzen zu dürfen“, sagte Gardner. „Für den normalen Endbenutzer wird es sehr schwierig sein, zu behaupten, dass er Anspruch auf irgendeine Art von Zahlung oder Entschädigung für die Nutzung seiner Daten im Rahmen der Schulung hat.“

Siehe auch  ChatGPT absolvierte auf Postgraduiertenniveau im 1. Studienjahr eine orthopädische Ausbildungsprüfung

Die Klage trägt auch zur wachsenden Liste rechtlicher Herausforderungen für die Unternehmen bei, die KI-Technologie aufbauen und davon profitieren wollen. Im November wurde eine Sammelklage gegen OpenAI und Microsoft eingereicht, weil die Unternehmen Computercode auf der Microsoft-eigenen Online-Codierungsplattform GitHub zum Trainieren von KI-Tools nutzten. Im Februar verklagte Getty Images Stability AI, ein kleineres KI-Start-up, mit der Begründung, es habe seine Fotos illegal zum Trainieren seines bildgenerierenden Bots verwendet. Und diesen Monat wurde OpenAI von einem Radiomoderator in Georgia wegen Verleumdung verklagt, der sagte, ChatGPT habe einen Text produziert, der ihn zu Unrecht des Betrugs beschuldigte.

OpenAI ist nicht das einzige Unternehmen, das Datenmengen aus dem offenen Internet zum Trainieren seiner KI-Modelle nutzt. google, Facebook, Microsoft und eine wachsende Zahl anderer Unternehmen tun dasselbe.Aber Clarkson entschied sich für OpenAI, weil es seine größeren Konkurrenten dazu anspornte, ihre eigene KI auf den Markt zu bringen, als es letztes Jahr mit ChatGPT die Fantasie der Öffentlichkeit erregte, sagte Clarkson.

„Sie sind das Unternehmen, das dieses KI-Wettrüsten entfacht hat“, sagte er. „Sie sind das natürliche erste Ziel.“

OpenAI teilt nicht mit, welche Art von Daten in sein neuestes Modell, GPT4, eingeflossen sind, aber frühere Versionen der Technologie haben nachweislich Wikipedia-Seiten, Nachrichtenartikel und Kommentare in sozialen Medien verarbeitet. Chatbots von Google und anderen Unternehmen haben ähnliche Datensätze verwendet.

Regulierungsbehörden diskutieren über die Verabschiedung neuer Gesetze, die von Unternehmen mehr Transparenz darüber verlangen, welche Daten in ihre KI eingespeist werden. Es sei auch möglich, dass ein Gerichtsverfahren einen Richter dazu veranlassen könnte, ein Unternehmen wie OpenAI zur Herausgabe von Informationen darüber zu zwingen, welche Daten es verwendet habe, sagte Gardner, der Anwalt für geistiges Eigentum.

Siehe auch  ChatGPT kann bei der Behandlung von Depressionen besser sein als Ärzte [BADANIA] - Pulsmedycyny

Einige Unternehmen haben versucht, KI-Firmen davon abzuhalten, ihre Daten zu stehlen. Laut Financial Times forderte der Musikvertrieb Universal Music Group im April apple und Spotify auf, Scraper zu blockieren. Die Social-Media-Seite Reddit sperrt den Zugriff auf ihren Datenstrom und verweist darauf, dass Big-Tech-Unternehmen jahrelang die Kommentare und Konversationen auf ihrer Seite gelöscht haben. Twitter-Inhaber Elon Musk drohte mit Klage Microsoft für die Verwendung von Twitter-Daten, die es vom Unternehmen erhalten hatte, um seine KI zu trainieren. Musk baut sein eigenes KI-Unternehmen auf.

Die neue Sammelklage gegen OpenAI geht in ihren Vorwürfen noch weiter und argumentiert, dass das Unternehmen gegenüber Personen, die sich für die Nutzung seiner Tools anmelden, nicht transparent genug sei, um die in das Modell eingegebenen Daten möglicherweise zum Trainieren neuer Produkte des Unternehmens verwenden zu können wird Geld verdienen, beispielsweise mit seinem Plugins-Tool, mit dem andere Unternehmen OpenAIs nutzen können. Es wird außerdem behauptet, dass OpenAI nicht genug unternimmt, um sicherzustellen, dass Kinder unter 13 Jahren seine Tools nicht nutzen, was anderen Technologieunternehmen wie Facebook und YouTube im Laufe der Jahre vorgeworfen wurde.

4.5/5 - (210 votes)
Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein