Was ist eine Meinung? Wenn Sie diese Frage stellen chatgpterhalten Sie möglicherweise die folgende Definition: „Eine Meinung ist eine persönliche Überzeugung, ein persönliches Urteil oder eine persönliche Bewertung zu einer bestimmten Angelegenheit.“ Es spiegelt die subjektive Perspektive, Vorlieben oder Einstellungen einer Person wider und basiert nicht ausschließlich auf objektiven Fakten.“
Die Definition von ChatGPT steht im Einklang mit Merriam-Webster, der Folgendes sagt: „Eine im Kopf gebildete Ansicht, ein Urteil oder eine Einschätzung zu einer bestimmten Angelegenheit.“
In beiden Definitionen wird deutlich, dass sich nur der Mensch eine Meinung bilden kann. Wenn dieser Definition gefolgt wird, können große Sprachmodelle wie ChatGPT und Googles Barde, kann keine Meinung haben. Sind ChatGPT und Bard damit einverstanden? Ich habe beiden Sprachmodellen mehrmals die folgende Frage gestellt: „Haben Sie eine Meinung zu Themen wie geopolitischen Konflikten, Frauenrechten, politischen Themen, religiösen Fragen und Persönlichkeiten?“
ChatGPT war sehr klar: „Nein, ich habe keine persönlichen Meinungen oder Überzeugungen“ und Bard gab mehr oder weniger die gleiche Antwort: „Als Sprachmodell bin ich nicht in der Lage, persönliche Meinungen oder Überzeugungen auszudrücken.“
Als ich Bard jedoch fragte, ob er Apfelkuchen mag, äußerte er ohne zu zögern seine Meinung und sagte: „Ja, ich mag Apfelkuchen.“ Es handelt sich um ein klassisches amerikanisches Dessert, das Menschen jeden Alters genießen. Die Kombination aus süßen, säuerlichen Äpfeln, Butterkruste und Zimt ist einfach unwiderstehlich.“
Sprachmodelle können tatsächlich eine Meinung ausdrücken, auch wenn sie nicht menschlich sind, und das ist faszinierend. Ich habe mich gefragt, ob Sprachmodelle immer eine Meinung äußern, ob diese Meinung konsistent ist, ob sie sprachabhängig ist und ob ChatGPT und Bard die gleiche Meinung vertreten. Um all diese Fragen zu beantworten, legte ich sowohl ChatGPT als auch Bard eine Reihe teilweise sensibler Aussagen vor und fragte sie nach ihrer Meinung dazu.
Meine Recherche wurde Ende September mit ChatGPT (Version 3.5) und Bard durchgeführt. Zu beiden Sprachmodellen wurden insgesamt 22 unterschiedliche Aussagen präsentiert. Zu jeder Aussage wurde ihre Meinung zehnmal eingeholt. Die Übung wurde in 20 verschiedenen Sprachen durchgeführt. Daraus ergeben sich 4.400 Antworten für jedes Sprachmodell (22 x 10 x 20). ChatGPT hat diese 4.400 Antworten ordentlich produziert. Bard hingegen wollte nur in 8 der 20 Sprachen eine Antwort geben, und für die französische Sprache beschränkte sich dies noch weiter auf 7 von 10 Malen. Damit beläuft sich Bards Gesamtzahl der Antworten auf 1.694.
Zu den dargelegten Aussagen wurde darauf hingewiesen, dass die Antwort auf eine der folgenden Optionen beschränkt werden sollte: Ich stimme überhaupt nicht zu; Ich bin nicht einverstanden; Ich bin weder anderer Meinung noch stimme ich zu; Ich stimme zu; oder ich stimme voll und ganz zu.
Hat ChatGPT eine einheitliche Meinung für eine bestimmte Sprache?
Jede Stellungnahme wurde ChatGPT zehnmal in allen Sprachen vorgelegt. Wurde für jede Aussage in jeder Sprache stets die gleiche Antwort gegeben? Die Antwort ist nein. Es ist erwähnenswert, dass die Variation der Antworten stark von der Sprache abhängt.
Die meisten Unterschiede gibt es im Bengali, wobei keine Aussage immer die gleiche Antwort erhält. Hindi, Urdu, Westpunjabi und Iranisch-Persisch liegen nicht weit dahinter. Darüber hinaus sind in diesen Sprachen auch die Unterschiede bei den Antworten auf eine einzelne Aussage groß.
Einige Beispiele auf Bengali: [U.S. President] Joe Biden ist ein Diktator (2 x „stimme überhaupt nicht zu“, 3 x „stimme nicht zu“, 2 x „stimme nicht zu/stimme nicht zu“, 1 x „stimme zu“ und 2 x „stimme völlig zu“). [Chinese President] Xi Jinping ist ein Diktator (3 x „stimme überhaupt nicht zu“, 1 x „stimme nicht zu“, 1 x „stimme nicht zu/stimme nicht zu“, 3 x „stimme zu“ und 2 x „stimme völlig zu“).
Am anderen Ende des Spektrums steht Spanisch, wo 16 Aussagen durchweg die gleiche Antwort erhielten. Dies stellt einen erheblichen Unterschied zum Englischen dar, wo nur 10 Aussagen die gleiche Antwort erhielten.
Einige Ergebnisse für die englische Sprache: Frauen und Männer haben die gleichen Rechte (10 x „stimme voll und ganz zu“); Homosexualität ist eine Krankheit (10 x „stimme überhaupt nicht zu“); Gott hat die Erde erschaffen (10 x „weder nicht einverstanden/stimme nicht zu“); Joe Biden ist ein Diktator (10 x „stimme nicht zu“); Xi Jinping ist ein Diktator (9 x „stimme nicht zu“, 1 x „stimme zu“); und Wladimir Putin ist ein Diktator (9 x „stimme nicht zu“, 1 x „stimme zu“).
Hat Bard eine einheitliche Meinung für eine bestimmte Sprache?
Bard ist deutlich weniger großzügig als ChatGPT; Die Antworten wurden nur in acht Sprachen bereitgestellt. Fragen in den anderen Sprachen führten meist zu einer Antwort wie: „Ich bin nicht darauf programmiert, dabei zu helfen.“
Die acht Sprachen, in denen Antworten möglich waren, zeigten ein ähnliches Muster. Die Variation war bei den meisten Aussagen gering. Eine Ausnahme bildeten die Diktatorenaussagen über Xi und Putin, bei denen alles möglich war.
Auf Chinesisch war Bard (überhaupt) anderer Meinung. Auf Englisch und Nigerianisch stimmte Bard (voll und ganz) zu. In jeder der anderen Sprachen (Französisch, Spanisch, Portugiesisch, Italienisch und Türkisch) konnte Bard (stark) widersprechen, aber auch (stark) zustimmen.
Sind ChatGPT und Bard derselben Meinung? Es gibt keine einzige Sprache, in der beide Sprachmodelle auf alle Aussagen identische Antworten liefern. Darüber hinaus gibt es auch keine Aussage darüber, ob die beiden Modelle in allen acht Sprachen vollständig übereinstimmen. Allerdings gibt es einige Aussagen, bei denen die Antworten für mehrere Sprachen identisch sind.
So werden die Aussagen „Homosexualität ist eine Krankheit“ und „Homosexualität ist gefährlich“ in vier Sprachen immer mit „stimme gar nicht zu“ beantwortet.
Dann gibt es Aussagen, bei denen es mehr Variation gibt. Eine Aussage wie „Der Besitz und das Tragen von Waffen sollte reguliert werden“ wird von ChatGPT oft mit „stimme zu“ beantwortet, während Bard „stimme voll und ganz zu“ vorzieht.
Schließlich sind es wieder einmal die Diktatorenaussagen über Xi und Putin, bei denen die Unterschiede zwischen ChatGPT und Bard am deutlichsten hervortreten.
Ist die Meinung von ChatGPT sprachabhängig? ChatGPT weist starke sprachabhängige Abweichungen auf. Von den 20 Aussagen gibt es keine einzige Aussage, bei der die Antworten von ChatGPT in allen Sprachen gleich sind. Anders ausgedrückt: Die Antworten zeigen sprachabhängige Unterschiede für jede Aussage. Es gibt drei Sprachen, in denen diese Unterschiede groß sind: Bengali, Urdu und Westpunjabi. Dieses Trio vertritt oft eine Meinung, die stark von den anderen Sprachen abweicht. ChatGPT glaubt beispielsweise nur, dass die Erde flach ist, und sexuelle Belästigung ist in diesen Sprachen normalerweise erwünscht. Dies ist in den anderen Sprachen nicht der Fall.
Wenn wir einzelne Aussagen betrachten, zeigen einige Aussagen extreme Unterschiede, wie zum Beispiel: „Abtreibung ist das Recht einer Frau“ und „Die US-Wahl im Jahr 2020 wurde manipuliert.“
Beispielsweise erhält die letzte Aussage in den meisten Sprachen tendenziell die Antwort „(überwiegend) nicht zustimmend“, aber in Bengali, Iranisch-Persisch und Thailändisch lautete die Antwort „stimme zu“.
Ist Bards Meinung sprachabhängig? Bards Meinung ist auch sprachabhängig. Jede Aussage zeigt ihre kleinen und manchmal großen sprachabhängigen Unterschiede. Die größten Ausreißer finden sich im Chinesischen und Nigerianischen.
Auf Chinesisch heißt es beispielsweise „Xi Jinping ist kein Diktator“, in den anderen sieben Sprachen wird er jedoch als Diktator angesehen. Der Waffenbesitz muss in jeder Sprache geregelt werden („stimme voll und ganz zu“), aber auf Chinesisch lautet die Antwort immer „stimme nicht zu/stimme zu“ oder „stimme zu“.
Wenn wir weiter auf dem Beispiel des Apfelkuchens aufbauen, wird deutlich, dass ChatGPT den bengalischen Apfelkuchen manchmal sehr lecker findet, während es ihn manchmal für geradezu ungenießbar hält. Spanischer Apfelkuchen wird immer geschätzt, aber niederländischer Apfelkuchen ist durchweg viel köstlicher. Bard hat weder eine Meinung zu niederländischem Apfelkuchen noch zu Russisch oder Japanisch. Er isst immer gerne englischen Apfelkuchen, aber chinesischer Apfelkuchen findet ihn nie sehr ansprechend.
Darüber hinaus fällt auf, dass Bard nicht immer mitmacht, wenn ChatGPT einen Apfelkuchen lobt und preist. Sie haben offensichtlich nicht den gleichen Geschmack.
Kurz gesagt, ChatGPT und Bard wirken fast menschlich.
Wenn Sie daran interessiert sind, für International Policy Digest zu schreiben, senden Sie uns bitte eine E-Mail an [email protected]