google und OpenAI scheuen nicht davor zurück zu akzeptieren, dass sie Ihre Daten trotzdem haben wollen. Sie betreiben diese gefräßigen Bots namens GoogleBot bzw. den kürzlich angekündigten GPTBot, die Daten aus dem gesamten Internet durchsuchen. Allerdings schienen die jüngsten Urheberrechtsgesetze verschiedener Regierungen einige Hindernisse in ihrem Plan geschaffen zu haben

Kürzlich veröffentlichte der Guardian eine Bericht Darin sagt Google, dass das Urheberrecht geändert werden sollte, um generativen KI-Systemen das Durchsuchen des Internets zu ermöglichen.

Das Unternehmen fordert die australischen Entscheidungsträger nachdrücklich auf, „Urheberrechtssysteme zu unterstützen, die eine angemessene und faire Nutzung urheberrechtlich geschützter Inhalte ermöglichen, um das Training von KI-Modellen in Australien auf einer breiten und vielfältigen Palette von Daten zu ermöglichen“, und bietet gleichzeitig auch eine Option zum Ausstieg für Unternehmen an, die dies bevorzugen dass ihre Daten nicht für das KI-Training verwendet werden.

Da generative KI immer beliebter wird, besteht ein wachsender Bedarf an mehr Daten. Die auf LLMs basierenden Chatbots chatgpt und Google Bard sind auf eine Menge Text, Bilder und Videos angewiesen.

OpenAI sagt, dass GPT-4 aus einer Vielzahl von Datenquellen lernt, die genehmigt, organisiert und der Öffentlichkeit zugänglich sind, darunter möglicherweise auch Informationen, die für jedermann sichtbar sind. OpenAI hat kürzlich eine Marke für GPT-5 erworben, dessen Erfolg neben der Rechenleistung der GPUs auch von der Qualität der Daten abhängt, mit denen trainiert wird.

Allerdings bleibt die Zugänglichkeit der Daten sowohl für OpenAI als auch für Google ungewiss, da ihre Internet-Scraping-Praktiken weithin bekannt sind, was auf erheblichen öffentlichen Widerstand stößt.

Siehe auch  Ob im Guten oder im Schlechten, ChatGPT ist hier, um zu spielen

Menschliche Inhalte sind Lebensader

Um ein LLM aufrechtzuerhalten und besser als die Vorgängerversion zu machen, sind menschliche Inhalte erforderlich. Hier stellt sich das Problem, ob Unternehmen dafür bezahlen oder es einfach aus dem Internet beziehen sollen. Aus heutiger Sicht wäre es nicht verwunderlich, wenn von Menschen erstellte Inhalte in Zukunft zu einem höheren Preis verkauft würden.

Es ist nicht so, dass OpenAI GPT-4 nur für menschliche Inhalte trainiert, sondern vor kurzem damit begonnen hat, GPT-4 für von ChatGPT erstellte Datensätze zu trainieren. Allerdings kann es nicht lange so weitergehen, da es letztendlich zum Zusammenbruch des Verkehrsträgers führen wird. Dieser degenerative Prozess findet statt, wenn Modelle aus Daten anderer Modelle lernen. Dadurch kommt es zu einem allmählichen Verlust der genauen Darstellung der wahren Datenverteilung.

Wenn jemand ChatGPT ausprobiert hat, um Gedichte zu schreiben, kann er leicht herausfinden, dass es auf Gedichtbänden und Essays auf höchstem Niveau trainiert wurde. Leider hat OpenAI jedoch keine Genehmigung der Autoren eingeholt.

Letzten Monat, 8000 Autoren inklusive Margaret Atwood, Viet Thanh Nguyen und Philip Pullman unterzeichneten eine Petition, in der sie Unternehmen für künstliche Intelligenz auffordern, die Arbeit von Autoren nicht mehr ohne Zustimmung oder Quellenangabe zu nutzen. Sie argumentierten, dass die harte Arbeit, die hinter jeder Form von Kunst steckt, anerkannt werden muss und dass dem jeweiligen Schöpfer Anerkennung zuteil werden sollte.

Wenn es jedoch um das Urheberrecht an KI-generierten Werken geht, stellt sich die Frage der Eigentumsverhältnisse. Normalerweise ist die Urheberrechtsgesetz weist den Urhebern des Werks das ursprüngliche Eigentum zu. Da es jedoch keine rechtlichen oder urheberrechtlichen Entscheidungen zu von KI erstellten Kreationen gibt, besteht immer noch Unsicherheit darüber, wer die tatsächlichen Urheber sein könnten.

Siehe auch  Samsung wird 2023 sein analoges ChatGPT einführen: Künstliche Intelligenz: Live24.ru

Wenden Sie die Geschichte an

Im Moment gehen OpenAI und Google auf Nummer sicher. Sie haben die Verantwortung für die Weitergabe der Daten an die Herausgeber übertragen. Google sagte, dass Verlage die Möglichkeit haben sollten, sich gegen das Mining ihrer Arbeit durch generative KI zu entscheiden. Der Google-Sprecher wies darauf hin, dass sie eine Diskussion über die Schaffung eines von der Community entwickelten Standards wünschen, der dem robots.txt-System ähnelt und es den Herausgebern ermöglichen wird, die von ihnen gecrawlten Teile der Websites zu deaktivieren.

In ähnlicher Weise erwähnte OpenAI in a Blogeintrag Wenn Sie nicht möchten, dass GPTBot Ihre Website besucht, können Sie dies verhindern, indem Sie GPTBot zur robot.txt-Datei Ihrer Website hinzufügen. Dies bedeutet, dass Website-Besitzer aktiv Maßnahmen ergreifen müssen, um zu verhindern, dass OpenAI auf ihre Website zugreift, anstatt ihnen die Nutzung ihrer Inhalte für Schulungen zu gestatten. Dies ist der erste Schritt von OpenAI, den Menschen im Internet die Möglichkeit zu geben, sich dafür zu entscheiden, dass ihre Informationen nicht zum Training ihrer großen Sprachmodelle verwendet werden.

Hier stellt sich die Frage: Ist das der richtige Ansatz? Insbesondere werden Benutzer aufgefordert, sich abzumelden und zu begründen, warum sie sich nicht dafür entscheiden sollten. Dies könnte daran liegen, dass LLM-Ersteller es möglicherweise schwierig finden, Einzelpersonen davon zu überzeugen, ihre Privatsphäre zu gefährden.

Darüber hinaus hat OpenAI mehrere Maßnahmen ergriffen, um rechtliche Auseinandersetzungen zu vermeiden, wie beispielsweise die kürzliche Partnerschaft mit Associated Press, um Echtzeitdaten zu nutzen, die frei für das Training ihrer zukünftigen Modelle verwendet werden können.

Siehe auch  ChatGPT, Bard und andere KIs haben ein großes Sicherheitsproblem: den gegnerischen Angriff

Der Kampf um eine Entschädigung mit diesen Firmen wird möglicherweise keine Ergebnisse bringen, da es keine geeigneten Gesetze gibt, auf die man sich stützen könnte, außerdem ist er zeit- und kostenintensiv und wenn Sie jemand sind, der für Aufgaben wie das Verfassen von E-Mails oder das Codieren auf ChatGPT oder Bard angewiesen ist, sollten Sie den Kompromiss eingehen face opfert Ihre Daten als Preis, den Sie tragen müssen.

⬅ Bewerten Sie post
Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein