Informationswissenschaftler an der UC Berkeley, Barman ( David Bamman ) hat etwas getan, was viele Leute oft mit GPT3 und GPT4 machen. Er „quantifiziert“ Kunstforschung. Er möchte GPT-4 verwenden, um sie zuerst zu testen. Er hat 4000 Wörter „Stolz und Vorurteil“ für GPT-4 eingegeben. Und Stellen Sie eine einfache Frage: „Welche Beziehung besteht zwischen den Charakteren?“.

Die GPT-4-Version ist in Bezug auf die Charakterbeziehungen in „Stolz und Vorurteil“ fast sehr genau, als ob der Roman zuvor studiert worden wäre. „Dieses Ergebnis war sehr unerwartet“, sagte Bunman. „Entweder kannte es die Aufgabe sehr gut, oder es kannte das Buch sehr gut, weil es Pride and Prejudice unzählige Male im Internet gelesen hatte.“

Das Problem ist, dass wir nicht wissen können, wie GPT-4 dieses Wissen erlangt hat. Die darin enthaltenen großen Sprachmodelle sind eine Pandora, und ihre Trainingsdaten sind für ihre Funktion so wichtig, dass ihre Schöpfer sie exklusiv geheim halten. Deshalb beschloss Banmans Team, „Datenarchäologen“ zu werden.

Um herauszufinden, was GPT-4 gelesen hatte, testeten sie verschiedene Bücher, als ob sie ein Englischschüler wären. Sie gaben jedem Buch eine Punktzahl, wobei höhere Punktzahlen darauf hindeuteten, dass das Buch eher Teil der Bibliothek des Roboters war.

Überraschenderweise erfreut sich diese geheime Leseliste großer Beliebtheit:

  1. Harry Potter: Der Stein der Weisen

  2. 1984 (George Orwell)

  3. Der Herr der Ringe: Die Gefährten

  4. fünfzig Graustufen

  5. Hungrige Spiele

  6. Herr der Fliegen

  7. Per Anhalter durch die Galaxis (leichter Science-Fiction-Comedy-Roman)

  8. Desintegration (auch übersetzt als „Auseinanderfallen“ oder „die unerträgliche Last des Lebens“)

  9. Das Silmarillion

  10. Fahrenheit 451 (ein dystopischer Roman)

  11. Game of Thrones

  12. Da Vinci-Code

Siehe auch  ChatGPT schlägt Möglichkeiten vor, eine Entlassung zu überstehen

Ab dem 13. Platz liegt die Punktzahl bei etwa 25 Punkten, es gibt zwar noch berühmte Romanklassiker wie „Das Gesamtwerk des Sherlock Holmes“ und „Moby Dick“, doch in dieser Liste steckt ein Geheimnis: Ein 14-Jähriger bekennender Science-Fiction-Fan und eine besessene Leseliste für Nerds. Das heißt also, dass GPT-4 tatsächlich ein Science-Fiction-Fan und Nerd ist?

Was eine KI liest, ist wichtig

Basierend auf dem Papier kam Banmans Team zu dem Schluss, dass sich die Liste der urheberrechtlich geschützten Bücher, die von GPT-4 (dem Nachfolger von GPT-3.5) aufgenommen wurden, nicht wesentlich von früheren Versionen unterscheidet. Doch in dieser Liste weist GPT-4 ein besonderes Merkmal auf.

Diese Liste stellt tatsächlich die selbsternannte Late-Night-Science-Fiction-Leseliste jedes einsamen heterosexuellen weißen Nerds der Generation X aus dem Jahr 1984 dar. Die Frage ist: Was bedeutet es für uns, wenn GPT-4 die Lesepräferenzen eines 14-jährigen Idioten im Jahr 1984 hat?

Das Vorhandensein dieser speziellen Bücher in GPT-4 spiegelt möglicherweise einfach ihre Allgegenwärtigkeit im Internet wider, aus dem diese Daten stammen. Als Bunmans Team gemeinfreie Bücher in den Test einbezog, erzielte das Modell sogar noch bessere Ergebnisse, wobei „Alice im Wunderland“ die Liste mit sagenhaften 98 Punkten anführte. Und das Internet und die Unternehmen, die KI entwickeln, neigen dazu, den normalen heterosexuellen Weißen und seine Lieblings-Science-Fiction-Filme zu stark zu repräsentieren. Bunmans Team stellte tatsächlich fest, dass große Sprachmodelle ungefähr den gleichen Anteil an Büchern mit höheren Bewertungen ausmachten wie im Internet. Dies ist gut dokumentiert, die KI wählt nicht die Bücher aus, die sie liest, sondern wird von der Internetkultur beeinflusst.

Siehe auch  Benutzerdefinierte Anweisungen im aktuellen ChatGPT-iOS-App-Update enthalten

Wissenschaftler sind optimistisch, was die Verbesserung des KI-Regulierungssystems und der Transparenz angeht

Man kann sich leicht vorstellen, dass alle Science-Fiction-Literatur, die eine KI liest, die gleichen schädlichen Auswirkungen auf sie haben würde wie andere Trainingsdaten, was zu zufälligen Verzerrungen führen würde. Manchmal machen sie rassistische Bemerkungen. Sie können Fehlinformationen wiederholen, als ob sie wahr wären, wie es im Internet oft der Fall ist. Dies sind bekannte Risiken und ein Grund, warum Samuel Harris Altman, CEO von OpenAI, kürzlich den Kongress gebeten hat, sein Geschäft zu regulieren.

„Die Quelle der Daten, auf denen diese Modelle trainiert werden, wird sich auf ihre Modelle und die Werte auswirken, die sie repräsentieren“, sagte Bunman und bemerkte, dass sie, wenn sie nur Cormac McCarthy gelesen hätten, möglicherweise eine dunkle und brutale Sicht auf den Existentialismus zum Ausdruck bringen würden. Was passiert also, wenn Roboter alle möglichen Romane über dunkle und dystopische Welten lesen? „Wie wirkt sich dieses Genre auf das Verhalten dieser Modelle auf nicht-literarische oder narrative Weise aus? In diesem Bereich gibt es noch viel Interessantes zu tun“, sagte Bunman. „Aber ich glaube nicht, dass wir die Antwort noch haben.“

Technisch gesehen stellt KI nur statistische und vektorielle Beziehungen zwischen Wörtern her, aber aufgrund der Undurchsichtigkeit der von KI erstellten Hintergrunddatenbank kann Barmans Mining-Experiment hinter der KI-Datenbank die KI-Leseliste nicht erklären, was definitiv zu einer KI-Weltanschauung führen wird. Menschliche Erfahrungen und die Bücher, die wir lesen, haben großen Einfluss auf unsere eigene Weltanschauung, und bis OpenAI und andere KI-Entwickler ihre Trainingskorpora der öffentlichen Prüfung zugänglich machen, ist es schwer zu sagen, welche Auswirkungen die Leseliste von chatgpt auf ihre Ergebnisse hat.

Siehe auch  5 PDF-Reader-AIs zur Verwendung als ChatGPT

Hat KI bereits ein eigenes Weltbild? Oder einfach die Lerninhalte der Datenbank auswendig gelernt haben? Banman ist offensichtlich optimistisch. Er glaubt, dass KI den Menschen möglicherweise eine unerwartete Perspektive eröffnen wird, wenn es der KI gestattet wird, ein breiteres Spektrum an Werken zu lesen.

Herausgeber des Entwurfs: Li Baifeng

„Business Benefits“ befürwortet, dass „das Geschäft das größte öffentliche Gut ist“, und seine Berichte konzentrieren sich darauf, den Lesern zu ermöglichen, die Macht des Kapitals, die Natur des Geschäfts und die Sprache der Finanzen und Wirtschaft zu verstehen.Willkommen Discord-Communityund melden Sie sich für ein kostenloses Abonnement anE-Newsletter zu Geschäftsvorteilen

Weiterführende Literatur:

Die Gefahr ist nicht zu unterschätzen! Sam Altman soll aussagen: KI sollte wie Kernenergie reguliert werden Gepostet von OpenAIGPT-4, fünf Stärken, um Konkurrenten zu vernichten, zwei Möglichkeiten, es zuerst zu versuchen! Huang Renxun spricht mit dem Chefwissenschaftler von OpenAI: Wie wird ChatGPT trainiert? Wie stark ist GPT-4?

5/5 - (119 votes)
Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein