google.com/publications/CAAqBwgKMLz2gwsw-5CAAw“ aria-label=“Follow PsyPost on Google News“>Folgen Sie Psypost Auf Google News

Während einige hochkarätige Forschungsarbeiten darauf schließen lassen, dass künstliche Intelligenz (KI) die menschliche Kreativität übertroffen hat, Internationale Zeitschrift für Mensch-Computer-Interaktion bietet eine differenziertere Sichtweise. Wissenschaftler fanden heraus, dass KI zwar hervorragend darin ist, vielfältige Interpretationen mehrdeutiger Bilder zu generieren, menschliche Bewerter menschliche Reaktionen jedoch immer noch als kreativer empfinden. Diese Ergebnisse zeigen, dass die menschliche Kreativität in bestimmten Bereichen immer noch einen Vorteil gegenüber der KI hat.

Die rasante Entwicklung und Implementierung von KI-Systemen wie chatgpt von OpenAI, Llama von Meta und Google Bard haben eine breite Diskussion über ihre Auswirkungen auf die Gesellschaft und das Konzept der Kreativität ausgelöst. Während sich KI weiterentwickelt und Aufgaben übernimmt, die traditionell dem Menschen vorbehalten sind, gibt es wachsende Bedenken hinsichtlich der Verdrängung menschlicher Arbeitskraft, der Auswirkungen auf die Bildung und der ethischen Dimension von KI-generierten Inhalten.

„Wir wollten dieses Thema erforschen, weil KI-Sprachmodelle wie ChatGPT sich rasant weiterentwickeln und bemerkenswert menschenähnliche Textausgaben erzeugen können. Wir möchten die aktuellen Fähigkeiten dieser Modelle im Vergleich zur menschlichen Leistung verstehen. Allgemeiner gesagt möchten wir verstehen, wie diese KI die Art und Weise verändern wird, wie Menschen Kreativität wahrnehmen, und welche sozialen Auswirkungen diese KI-Modelle haben könnten“, erklärte der Studienautor. Simone Grassiniaußerordentlicher Professor an der Universität Bergen.

Es herrscht große Aufregung, aber auch Bedenken darüber, ob die KI bei kreativen Aufgaben irgendwann die Fähigkeiten des Menschen übertreffen wird. Ziel dieser Studie war es, den aktuellen Stand der kreativen Fähigkeiten der KI im Vergleich zu Menschen empirisch zu untersuchen.

Um die kreativen Fähigkeiten von KI und Menschen im Vergleich zu untersuchen, nutzten die Forscher eine neu entwickelte Aufgabe namens Figural Interpretation Quest (FIQ). Diese Aufgabe beinhaltet die Interpretation mehrdeutige, abstrakte Figuren. Die Aufgabe ist darauf ausgelegt, divergentes Denken zu bewerten, einen kognitiven Prozess, bei dem mehrere einzigartige Lösungen oder Ideen als Antwort auf ein offenes Problem generiert werden. Dies steht im Gegensatz zum konvergenten Denken, bei dem es darum geht, eine einzige, richtige Lösung zu finden.

Grassini merkte an, dass der FIQ „von Natur aus multimodal ist – er erfordert sowohl die Wahrnehmung eines mehrdeutigen visuellen Bildes als auch die Generierung einer kreativen Textinterpretation dieses Bildes. Entscheidend ist, dass der FIQ ein erst kürzlich entwickelter Test ist, was bedeutet, dass das von uns getestete KI-System (ChatGPT-4) bis 2021 in seinen Trainingsdaten keine optimalen Antworten gefunden haben konnte. Dadurch konnten wir die Fähigkeit der KI bewerten, originelle kreative Lösungen zu ‚finden‘, anstatt einfach Antworten aus ihrem Trainingsspeicher abzurufen (eine wichtige Einschränkung, die alle zuvor veröffentlichten Studien zu diesem Thema gemeinsam haben).“

An der Studie nahmen 279 englische Muttersprachler teil, die über eine Online-Plattform rekrutiert wurden. 256 von ihnen schlossen die Studie ab. Diese Teilnehmer wurden gebeten, für jede der vier mehrdeutigen Figuren zwei verschiedene Interpretationen anzugeben. Ziel war es, Interpretationen zu erstellen, die sich semantisch so stark voneinander unterschieden wie möglich. Die Teilnehmer hatten 30 Sekunden Zeit, um ihre Interpretationen für jede Figur einzugeben. So wurde sichergestellt, dass sie unter einer Zeitbeschränkung antworteten, die realen kreativen Aufgaben ähnelte.

Siehe auch  YouTube experimentiert mit einem ChatGPT-ähnlichen KI-Chatbot, der unter ausgewählten Videos angezeigt wird

Parallel dazu wurde ChatGPT-4, ein fortschrittlicher KI-Chatbot, mit denselben vier Figuren getestet. Die KI wurde aufgefordert, Antworten unterschiedlicher Länge (ein, zwei oder drei Wörter) zu generieren, um die in menschlichen Daten beobachtete Verteilung der Antwortlängen zu simulieren. Dies wurde getan, um einen fairen Vergleich zwischen menschlichen und KI-Antworten zu gewährleisten. Die KI-Sitzungen wurden mehrmals durchgeführt, um einen robusten Datensatz KI-generierter Interpretationen zu sammeln.

Zur Beurteilung der Kreativität verwendeten die Forscher zwei Hauptmaßstäbe: Flexibilität und wahrgenommene Kreativität.

Die Flexibilität wurde anhand der semantischen Distanz zwischen den beiden Interpretationen jeder Abbildung bewertet. Je größer die semantische Distanz, desto flexibler wurden die Antworten betrachtet. Dieses Maß wurde mithilfe der SemDis-Plattform berechnet, die den Grad der Unterschiede zwischen den Bedeutungen zweier Antworten analysiert.

Um die wahrgenommene Kreativität zu bewerten, bewertete ein Gremium aus elf menschlichen Juroren, denen nicht bekannt war, ob die Antworten von Menschen oder der KI stammten, jede Interpretation auf einer Skala von 0 bis 2. Ein Wert von 0 bedeutete eine einfache oder nicht kreative Antwort, 1 eine kreative Antwort und 2 eine außergewöhnlich kreative Interpretation. Die Juroren waren Psychologiestudenten, die die Antworten im Rahmen ihrer Forschungsausbildung oder im Austausch gegen Universitätskredite bewerteten.

Die Forscher stellten fest, dass ChatGPT-4 im Vergleich zu Menschen ein höheres Maß an Flexibilität bei der Generierung von Interpretationen zeigte. Dies deutet darauf hin, dass KI in der Lage ist, semantisch unterschiedliche Ideen zu produzieren, was ihre Fähigkeit zeigt, in verschiedenen Kontexten divergent zu denken.

„Ein überraschender Aspekt war, wie gut das KI-Sprachmodell bei der Generierung semantisch unterschiedlicher Interpretationen der mehrdeutigen visuellen Bilder abgeschnitten hat“, sagte Grassini gegenüber PsyPost. „Seine Flexibilitätswerte auf Grundlage der semantischen Distanzanalyse waren im Durchschnitt höher als die des durchschnittlichen menschlichen Teilnehmers. Dies unterstreicht die bemerkenswerten natürlichen Sprachfähigkeiten großer Sprachmodelle.“

Trotz der größeren Flexibilität der KI empfanden menschliche Bewerter die von Menschen generierten Antworten insgesamt als kreativer. Dies deutet darauf hin, dass es Aspekte der Kreativität gibt, die über bloße semantische Vielfalt hinausgehen und wahrscheinlich mit der Fülle menschlicher Erfahrungen und der differenzierten Art und Weise zusammenhängen, wie Menschen Reize interpretieren.

Darüber hinaus übertrafen die menschlichen Antworten mit den höchsten Punktzahlen die besten KI-Antworten sowohl in Bezug auf wahrgenommene Kreativität als auch Flexibilität. Während die KI ein engeres Antwortspektrum produzierte, zeigten die menschlichen Teilnehmer eine größere Vielfalt an Ideen, was zu ihren höheren Kreativitätswerten beitrug.

Siehe auch  So nutzen Sie ChatGPT zur Lösung alltäglicher Probleme

„KI war hervorragend darin, semantisch vielfältige Interpretationen mehrdeutiger visueller Bilder zu erzeugen“, erklärte Grassini. „Wenn menschliche Gutachter jedoch die Kreativität der KI-Ergebnisse subjektiv im Vergleich zu echten Menschen bewerteten, neigten sie dazu, die menschlichen Antworten insgesamt als kreativer zu empfinden.“

„Dies deutet darauf hin, dass KI zwar über fortgeschrittene Fähigkeiten zur Produktion vielfältiger kreativer Ideen verfügt und sehr gut darin ist, unseren Anweisungen zu folgen, die menschliche Kreativität jedoch immer noch im Vorteil zu sein scheint, zumindest in der subjektiven Wahrnehmung. Die Studie hebt sowohl die bemerkenswerten Fortschritte der KI als auch einige ihrer derzeitigen Einschränkungen im Vergleich zur menschlichen Wahrnehmung hervor, wenn es um Kreativitätsaufgaben geht, die multimodale Verarbeitung und unbegrenzte Vorstellungskraft erfordern.“

Die Erkenntnisse deuten außerdem darauf hin, dass „es wichtige Aspekte der Kreativität geben könnte, die über die bloße semantische Vielfalt hinausgehen, wenn es darum geht, wie kreative Werke mit offenem Ende von anderen wahrgenommen werden, und dass KI und Menschen tatsächlich in unterschiedlichen Kreativitätsarten brillieren könnten, und dass es tatsächlich von der Art der Kreativität abhängen könnte, die wir testen, ob KI das menschliche (oder übermenschliche) Kreativitätsniveau erreicht hat oder nicht“, fügte Grassini hinzu.

Aber die Studie hat, wie alle Forschung, Einschränkungen, einschließlich ihres Fokus auf nur eine Art von Kreativitätsaufgabe mit mehrdeutigen visuellen Bildern, die möglicherweise nicht auf andere kreative Bereiche übertragbar ist. Darüber hinaus bedeutet der Stichtag für die Trainingsdaten der KI im September 2021, dass sie möglicherweise nicht vollständig für die FIQ-Aufgabe optimiert war, die später entwickelt wurde. Zukünftige Forschung könnte ein breiteres Spektrum kreativer Aufgaben untersuchen, um die Stärken und Grenzen der KI besser zu verstehen.

„Ein wichtiger Vorbehalt ist, dass sich unsere Studie nur auf einen bestimmten Typ von Kreativitätstest konzentrierte, bei dem es um die Interpretation mehrdeutiger visueller Bilder ging“, erklärte Grassini. „Obwohl wir dadurch die multimodale Verarbeitung bewerten konnten, sind die Ergebnisse möglicherweise nicht auf andere Arten kreativer Domänen oder Aufgaben übertragbar. Darüber hinaus haben wir ein einzelnes KI-Modell (ChatGPT-4) getestet, das im Vergleich zu den modernsten Modellen, die entwickelt werden, bereits veraltet ist, wie beispielsweise das neu vorgestellte ChatGPT4o, das in Bezug auf Multimodalität möglicherweise insgesamt bessere Fähigkeiten aufweist.“

Frühere Studien präsentierten unterschiedliche Ergebnisse zur Kreativität von KI im Vergleich zu Menschen, die stark von der Art und Weise beeinflusst wurden, wie die Kreativität im jeweiligen Fall gemessen wurde. In einer von NAME und seinen Kollegen durchgeführten Studie schnitt KI in einem kreativen Denktest, dem sogenannten Torrance Tests of Creative Thinking, besser ab als der durchschnittliche Mensch. Dieser Test beurteilt die Kreativität anhand von Faktoren wie Flüssigkeit, Flexibilität, Originalität und Ausführlichkeit bei der Formulierung von Antworten auf offene Fragen. Die überlegene Leistung der KI in diesem Test lässt darauf schließen, dass sie bei Aufgaben, die eine breite und schnelle Ideenproduktion erfordern, hervorragende Leistungen erbringen kann, wobei sie von ihren riesigen Trainingsdaten und ihrer Verarbeitungsgeschwindigkeit profitiert.

Siehe auch  Acht Nachrichtenagenturen verklagen den ChatGPT-Entwickler OpenAI und Microsoft wegen angeblicher Urheberrechtsverletzung

Eine andere Studie kam zu dem Ergebnis, dass KI im oberen Perzentil des kreativen Denkens abschnitt. Die Studie verwendete eine divergente Denkaufgabe, bei der die Anzahl und Einzigartigkeit der Ideen gemessen wurde, die als Reaktion auf Aufforderungen generiert wurden. Diese Art von Aufgabe betont die Fähigkeit, eine große Vielfalt an Ideen hervorzubringen, ein Bereich, in dem KI durch ihre Fähigkeit, aus umfangreichen Datensätzen zu schöpfen, und ihre algorithmische Effizienz dem durchschnittlichen Menschen einen Vorteil verschafft.

Eine Studie, die die Kreativität von Kindern untersuchte, verfolgte dagegen einen anderen Ansatz. Sie konzentrierte sich auf einfache Aufgaben, bei denen die Teilnehmer neue Verwendungsmöglichkeiten für Alltagsgegenstände finden mussten. Die Ergebnisse zeigten, dass Kinder die KI übertrafen, was verdeutlicht, dass menschliche Kreativität, insbesondere bei jüngeren Menschen, intuitive Sprünge und persönliche Erfahrungen beinhalten kann, die die KI nur schwer nachbilden kann.

„Unser langfristiges Ziel ist es, die kognitiven Mechanismen, die der menschlichen Kreativität zugrunde liegen, besser zu verstehen und sie mit der Operationalisierung von Kreativität in künstlichen Intelligenzsystemen zu vergleichen“, sagte Grassini gegenüber PsyPost. „Dies kann Aufschluss über die einzigartigen Stärken der menschlichen Kognition gegenüber KI-Ansätzen geben.“

„Wir möchten auch untersuchen, wie KI-Sprachmodelle möglicherweise die menschliche Kreativität erweitern oder unterstützen könnten, anstatt nur zu versuchen, sie zu kopieren oder zu ersetzen. Letztendlich kann ein besseres Verständnis der Kreativitätsfähigkeiten von Maschinen im Vergleich zur menschlichen Wahrnehmung dazu beitragen, die verantwortungsvolle Entwicklung von KI-Technologien voranzutreiben.“

„Ich denke, es ist wichtig zu betonen, dass unsere Studie nicht als Versuch interpretiert werden sollte, menschliche Kreativität im Vergleich zu künstlicher Kreativität insgesamt zu ‚bewerten‘“, fügte Grassini hinzu. „Beide beinhalten bemerkenswert komplexe kognitive Fähigkeiten, die sich nur schwer auf eine einzige Punktzahl reduzieren lassen. Darüber hinaus hebt die Studie einige wichtige Unterschiede im kreativen Prozess zwischen biologischer menschlicher Kognition und aktueller Sprach-KI hervor – wobei erstere möglicherweise besser auf multimodale Verarbeitung und subjektiven kreativen Ausdruck abgestimmt ist.“

„Da KI-Systeme multimodaler werden und umfassendere Erfahrungen in der Welt sammeln, könnte dies ihre kreativen Fähigkeiten weiter verbessern. Dies ist noch ein frühes Stadium der Forschung zu diesen Fragen. Wir stellen uns gerne vor, dass Menschen KI in Zukunft nutzen könnten, um ihr kreatives Potenzial zu verbessern und dabei die Art von Kreativität zu nutzen, in der KI hervorsticht.“

Die Studie, „Künstliche Kreativität? Bewertung der KI im Vergleich zur menschlichen Leistung bei der kreativen Interpretation visueller Reize„wurde von Simone Grassini und Mika Koivisto verfasst.

Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein