[ad_1]
Künstliche Intelligenz hat aufgrund ihrer Fähigkeiten in verschiedenen Bereichen Schlagzeilen gemacht, aber kann sie uns auch zum Lachen bringen? Eine kürzlich in der Zeitschrift PLUS EINS deutet darauf hin, dass KI auch beim Humor die Oberhand haben könnte. Die Forschung zeigt, dass KI-generierter Humor als genauso lustig oder lustiger bewertet wurde als von Menschen erstellte Witze, selbst im Vergleich zu professionellen Satirikern von The Onion.
Humor zu schaffen ist bekanntermaßen schwierig. Um als lustig wahrgenommen zu werden, müssen Witze ein Gleichgewicht zwischen Überraschung und Harmlosigkeit finden. Die meisten Menschen entwickeln ihren Sinn für Humor durch Erfahrung und Übung und erkennen Muster, die Witze funktionieren lassen. Forscher wollten herausfinden, ob große Sprachmodelle (LLMs), eine Art künstliche Intelligenz, die darauf ausgelegt ist, menschliche Sprache zu verstehen, zu generieren und zu manipulieren, diese menschliche Fähigkeit nachbilden können.
LLMs werden mithilfe großer Mengen Textdaten und komplexer Algorithmen erstellt, um Modelle zu erstellen, die Text vorhersagen und generieren können. Diese Modelle lernen durch die Verarbeitung und Analyse umfangreicher Datensätze, wodurch sie Muster erkennen, Kontext verstehen und zusammenhängende Textantworten auf Eingabeaufforderungen erstellen können.
Ziel der Studie war es herauszufinden, ob LLMs Humor erzeugen können, der bei den Menschen Anklang findet. Diese Frage ist besonders relevant angesichts der anhaltenden Debatte in der Unterhaltungsindustrie über den Einsatz von KI in kreativen Bereichen. Der leitende Forscher der Studie, Drew Gorenz von der University of Southern California, stellte fest, dass die jüngsten Streiks von Hollywood-Autoren und -Schauspielern die Angst unterstreichen, dass KI Arbeitsplätze und Kreativität in der Unterhaltungsindustrie bedrohen könnte.
Die Forscher führten zwei Hauptstudien durch, um die Fähigkeiten von KI und Menschen zur Humorproduktion zu vergleichen. Sie verwendeten OpenAIs chatgpt 3.5 für den KI-generierten Inhalt. Die erste Studie konzentrierte sich auf den Vergleich des Humors von ChatGPT mit dem von Laien, während die zweite den Humor von ChatGPT mit dem von professionellen Satirikern von The Onion verglich.
In der ersten Studie wurden 105 Teilnehmer von Amazon Mechanical Turk, einer Online-Arbeitsplatzplattform, gebeten, drei Humoraufgaben zu lösen. Diese Aufgaben beinhalteten das Erfinden humorvoller Phrasen für vorgegebene Akronyme, das humorvolle Beantworten von Lückentexten und das Ausdenken von Roast-Witzen als Reaktion auf hypothetische Szenarien. Den Teilnehmern wurde ausdrücklich gesagt, dass sie ihre eigene Vorstellungskraft nutzen und keine Witze aus anderen Quellen kopieren sollten.
ChatGPT 3.5 erhielt dieselben Aufgaben und produzierte 20 Antworten für jede Eingabeaufforderung. Diese von der KI generierten Witze wurden dann mit von Menschen erstellten Witzen gemischt und von einer separaten Gruppe von 200 Teilnehmern bewertet, die ihre Witzigkeit auf einer siebenstufigen Skala bewerteten.
Die Witze der KI wurden in drei verschiedenen Aufgaben durchweg als lustiger bewertet: Erstellen witziger Akronyme, humorvolles Vervollständigen von Lückentexten und Ausarbeiten von Roast-Witzen. Insgesamt waren die Witze von ChatGPT besser als die meisten von Menschen erstellten Witze, wobei die KI insbesondere bei der Roast-Witz-Aufgabe brillierte.
Insbesondere übertraf ChatGPT 73 % der menschlichen Teilnehmer bei der Akronym-Aufgabe, 63 % der menschlichen Teilnehmer bei der Lückentext-Aufgabe und 87 % der menschlichen Teilnehmer bei der Roast-Witz-Aufgabe.
In der zweiten Studie verglichen die Forscher von KI generierte satirische Schlagzeilen mit denen von The Onion. Sie verwendeten eine Stichprobe von 217 Studenten der University of Southern California. Jeder Student bewertete die Witzigkeit einer Mischung von Schlagzeilen, die von ChatGPT und The Onion generiert wurden, ohne die Quelle jeder einzelnen Schlagzeile zu kennen.
Die Ergebnisse zeigten keinen signifikanten Unterschied in den durchschnittlichen Witzigkeitsbewertungen zwischen den von der KI generierten Schlagzeilen und denen von The Onion. Unter den vier am höchsten bewerteten Schlagzeilen wurden zwei von ChatGPT und zwei von The Onion generiert. Bemerkenswert ist, dass die am höchsten bewertete Schlagzeile eine von der KI generierte war: „Einheimischer Mann entdeckt neues Gefühl, kann es noch immer nicht richtig beschreiben.“ Dies deutet darauf hin, dass ChatGPT satirische Inhalte produzieren kann, die mit denen professioneller Autoren mithalten können.
Diese Ergebnisse zeigen, dass KI, insbesondere ChatGPT 3.5, überraschend gut darin ist, Humor zu produzieren. Obwohl es der KI an Emotionen und persönlichen Erfahrungen mangelte, konnte sie Muster analysieren und Witze kreieren, die bei den Leuten gut ankamen.
„Da ChatGPT selbst keine Emotionen empfinden kann, aber neue Witze besser erzählt als der durchschnittliche Mensch, liefern diese Studien den Beweis, dass man nicht die Emotionen empfinden muss, die man mit der Wertschätzung eines guten Witzes verbindet, um selbst einen wirklich guten Witz zu erzählen“, sagte Gorenz.
Die Forscher untersuchten auch, ob demografische Faktoren die Humorbewertungen beeinflussten. Es zeigte sich, dass Alter, Geschlecht und politische Orientierung die Vorlieben der Teilnehmer für von der KI generierte gegenüber von Menschen generierten Witzen nicht signifikant beeinflussten. Dies deutet darauf hin, dass die Humorwirkung der KI breit gefächert war und nicht auf bestimmte demografische Gruppen beschränkt war.
Die Ergebnisse der Studie sind zwar faszinierend, aber sie sind mit einigen Vorbehalten verbunden. So waren die Humoraufgaben textbasiert und beinhalteten keine Darbietung, was ein entscheidender Bestandteil von Humor ist. KI-generierte Witze funktionieren möglicherweise nicht so gut in Formaten, bei denen es auf Timing und Präsentation ankommt, wie etwa Stand-up-Comedy oder Sketch-Shows.
„Dass ChatGPT schriftlichen Humor in einer Qualität produzieren kann, die die Fähigkeiten von Laien übersteigt und mit der einiger professioneller Comedy-Autoren mithalten kann, hat wichtige Auswirkungen auf Comedy-Fans und Mitarbeiter in der Unterhaltungsbranche“, schrieben die Forscher. „Für professionelle Comedy-Autoren deuten unsere Ergebnisse darauf hin, dass LLMs eine ernsthafte Beschäftigungsbedrohung darstellen können. Die Auswirkungen sind positiver für Menschen, die lediglich die Vorteile nutzen möchten, ihre alltägliche Kommunikation mit einer Portion Humor aufzuwerten. Sie können sich an LLMs wenden, um Hilfe zu erhalten.“
Die Studie, „Wie lustig ist ChatGPT? Ein Vergleich von von Menschen und KI produzierten Witzen”, wurde von Drew Gorenz und Norbert Schwarz verfasst.
[ad_2]