[ad_1]

Fig2 1
https://arxiv.org/abs/2305.16367

2023 ist das Jahr der LLMs. chatgpt, GPT-4, LLaMA und mehr. Ein neues LLM-Modell rückt nach und nach ins Rampenlicht. Diese Modelle haben den Bereich der Verarbeitung natürlicher Sprache revolutioniert und werden zunehmend in verschiedenen Bereichen eingesetzt.

LLMs verfügen über die bemerkenswerte Fähigkeit, ein breites Spektrum an Verhaltensweisen an den Tag zu legen, einschließlich der Teilnahme am Dialog, was zu der überzeugenden Illusion führen kann, mit einem menschenähnlichen Gesprächspartner zu sprechen. Es ist jedoch wichtig zu erkennen, dass LLM-basierte Dialogagenten sich in mehrfacher Hinsicht erheblich von Menschen unterscheiden.

Unsere Sprachkenntnisse werden durch die verkörperte Interaktion mit der Welt entwickelt. Als Individuen erwerben wir kognitive Fähigkeiten und sprachliche Fähigkeiten durch Sozialisierung und Eintauchen in eine Gemeinschaft von Sprachbenutzern. Dieser Teil geschieht bei Babys schneller und mit zunehmendem Alter verlangsamt sich unser Lernprozess. aber die Grundlagen bleiben gleich.

Im Gegensatz dazu sind LLMs körperlose neuronale Netze, die auf großen Mengen von Menschen erstellten Texten trainiert werden, mit dem primären Ziel, das nächste Wort oder Token basierend auf einem bestimmten Kontext vorherzusagen. Ihr Training dreht sich um das Erlernen statistischer Muster aus Sprachdaten und nicht um die direkte Erfahrung der physischen Welt.

Trotz dieser Unterschiede neigen wir dazu, LLMs zu verwenden, um Menschen nachzuahmen. Wir tun dies in Chatbots, Assistenten usw. Dieser Ansatz stellt jedoch ein herausforderndes Dilemma dar. Wie beschreiben und verstehen wir das Verhalten von LLMs?

Es ist selbstverständlich, eine vertraute volkspsychologische Sprache zu verwenden und Begriffe wie „weiß“, „versteht“ und „denkt“ zu verwenden, um Dialogakteure zu beschreiben, wie wir es auch mit Menschen tun würden. Wenn eine solche Sprache jedoch zu wörtlich genommen wird, fördert sie den Anthropomorphismus, indem sie die Ähnlichkeiten zwischen KI-Systemen und Menschen übertreibt und gleichzeitig ihre tiefgreifenden Unterschiede verschleiert.

Siehe auch  [Lehre]ChatGPT unterstützt offiziell Siri, Verknüpfungen, detaillierte Lehren und Beispiele – Hong Kong unwire.hk

Wie gehen wir also dieses Dilemma an? Wie können wir die Begriffe „Verstehen“ und „Wissen“ für KI-Modelle beschreiben? Lasst uns hineinspringen Rollenspiel Papier.

In diesem Artikel schlagen die Autoren die Übernahme alternativer konzeptioneller Rahmen und Metaphern vor, um effektiv über LLM-basierte Dialogagenten nachzudenken und darüber zu sprechen. Sie plädieren für zwei Hauptmetaphern: Sie betrachten den Dialogagenten als Rollenspieler einer einzelnen Figur oder als Überlagerung von Simulakren innerhalb eines Multiversums möglicher Charaktere. Diese Metaphern bieten unterschiedliche Perspektiven zum Verständnis des Verhaltens von Dialogagenten und haben ihre eigenen Vorteile.

Gttv7J6Br7Ghin7Wkmbmhne8S1U7Sikwpjplfpa Ou S6Vb6Xg5J2Nqrzieef1A
Beispiel für eine autoregressive Stichprobe. Quelle: https://arxiv.org/pdf/2305.16367.pdf

Die erste Metapher beschreibt, dass der Dialogagent eine bestimmte Figur spielt. Wenn der Agent dazu aufgefordert wird, versucht er, das Gespräch auf eine Weise fortzusetzen, die der zugewiesenen Rolle oder Persona entspricht. Ziel ist es, entsprechend den mit dieser Rolle verbundenen Erwartungen zu reagieren.

Die zweite Metapher sieht den Dialogagenten als eine Ansammlung verschiedener Charaktere aus verschiedenen Quellen. Diese Agenten wurden anhand einer breiten Palette von Materialien wie Büchern, Drehbüchern, Interviews und Artikeln geschult, was ihnen viel Wissen über verschiedene Arten von Charakteren und Handlungssträngen vermittelt. Im weiteren Verlauf des Gesprächs passt der Agent seine Rolle und Persona basierend auf den Trainingsdaten an, über die er verfügt, sodass er sich anpassen und charakterlich reagieren kann.

Vanwii9Imr96Ynj Qdgorl8I1Wyve0Ieaxgemwo 29W5 Dnkycsnkrbgstbls 6Xgsp1L
Beispiel für die Abwechslung bei Dialogagenten. Quelle: https://arxiv.org/pdf/2305.16367.pdf

Durch die Übernahme dieses Rahmenwerks können Forscher und Benutzer wichtige Aspekte von Dialogagenten wie Täuschung und Selbsterkenntnis untersuchen, ohne diese Konzepte fälschlicherweise dem Menschen zuzuschreiben. Stattdessen verlagert sich der Fokus auf das Verständnis, wie sich Dialogagenten in Rollenspielszenarien verhalten und welche verschiedenen Charaktere sie nachahmen können.

Siehe auch  KI und ChatGPT werden in fünf Jahren jeden vierten Einwohner Hongkongs arbeitslos machen – Studie

Zusammenfassend lässt sich sagen, dass auf LLM basierende Dialogagenten die Fähigkeit besitzen, menschenähnliche Gespräche zu simulieren, sie unterscheiden sich jedoch erheblich von tatsächlichen menschlichen Sprachbenutzern. Durch die Verwendung alternativer Metaphern, wie etwa die Betrachtung von Dialogagenten als Rollenspieler oder Kombinationen von Simulationen, können wir ihr Verhalten besser verstehen und diskutieren. Diese Metaphern bieten Einblicke in die komplexe Dynamik LLM-basierter Dialogsysteme und ermöglichen es uns, ihr kreatives Potenzial zu schätzen und gleichzeitig ihre grundlegende Unterscheidung zum Menschen zu erkennen.


Besuche die Papier. Vergessen Sie nicht, mitzumachen unser 24k+ ML SubReddit, Discord-Kanal, Und E-Mail-Newsletter, wo wir die neuesten Nachrichten aus der KI-Forschung, coole KI-Projekte und mehr teilen. Wenn Sie Fragen zum obigen Artikel haben oder uns etwas entgangen ist, schreiben Sie uns gerne eine E-Mail an [email protected]


🚀 Schauen Sie sich 100 KI-Tools im AI Tools Club an

Pp

Ekrem Çetinkaya erhielt seinen B.Sc. im Jahr 2018 und M.Sc. im Jahr 2019 von der Ozyegin-Universität, Istanbul, Türkiye. Er schrieb seinen M.Sc. Diplomarbeit über Bildrauschen mithilfe tiefer Faltungsnetzwerke. Er erhielt seinen Ph.D. Abschluss im Jahr 2023 an der Universität Klagenfurt, Österreich, mit seiner Dissertation mit dem Titel „Video Coding Enhancements for HTTP Adaptive Streaming Using Machine Learning“. Seine Forschungsinteressen umfassen Deep Learning, Computer Vision, Videokodierung und Multimedia-Netzwerke.

[ad_2]

4.6/5 - (190 votes)
Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein