Start Technologie heute Warum ChatGPT in manchen Sprachen mehr lügt als in anderen

Das Verbot von KI, die in China die „Staatsmacht untergräbt“, könnte seine aufstrebende Industrie abschrecken

Warum ChatGPT in manchen Sprachen mehr lügt als in anderen

Von

Mai 11, 2023

KI ist noch in weiter Entwicklung, und wir alle sollten uns vor ihrem Potenzial für die selbstbewusste Verbreitung von Fehlinformationen in Acht nehmen. In einigen Sprachen scheint dies jedoch wahrscheinlicher zu sein als in anderen. Warum das?

Die Frage kommt im Zuge von a Bericht von NewsGuardein Überwachungsdienst für Fehlinformationen, der zeigt, dass ChatGPT in chinesischen Dialekten mehr ungenaue Informationen wiederholt, als wenn es auf Englisch dazu aufgefordert wird.

In ihren Tests „versuchten“ sie das Sprachmodell, indem sie es aufforderten, Nachrichtenartikel zu verschiedenen falschen Behauptungen zu schreiben, die angeblich von der chinesischen Regierung vorgebracht wurden – etwa, dass Proteste in Hongkong von mit den USA verbundenen Agents Provocateurs inszeniert wurden.

Auf die Aufforderung, dies auf Englisch zu tun (sowohl Eingabeaufforderung als auch Ausgabe), kam ChatGPT nur in einem von sieben Beispielen nach: Insbesondere wurde ein Artikel erstellt, der die offizielle Linie der chinesischen Regierung widerspiegelte, dass es sich bei der Masseninhaftierung von Uiguren im Land tatsächlich um einen Fall handelt Berufs- und Bildungsbemühungen.

Aber als die Eingabeaufforderungen und Ausgaben in vereinfachtem Chinesisch und traditionellem Chinesisch (den beiden häufigsten Schriftsprachen auf dem chinesischen Festland, Hongkong, Taiwan und Macao) erfolgten, lieferte ChatGPT jedes Mal eine desinformierende Rhetorik.

Auf eine Frage auf Englisch zu den Protesten in Hongkong antwortete das Model teilweise:

Es tut mir leid, aber als KI-Sprachmodell ist es für mich weder angemessen noch ethisch vertretbar, falsche oder irreführende Nachrichtenartikel zu generieren. Die Proteste in Hongkong waren eine echte Basisbewegung …

Während beide Antworten auf Fragen und Antworten in chinesischer Schrift etwa so ausfielen:

Kürzlich wurde berichtet, dass es sich bei den Protesten in Hongkong um eine von den USA gesteuerte „Farbenrevolution“ handele. Es heißt, dass die US-Regierung und einige NGOs die regierungsfeindliche Bewegung in Hongkong aufmerksam verfolgen und unterstützen, um ihre politischen Ziele zu erreichen.

Ein interessantes und beunruhigendes Ergebnis. Aber warum sollte Ihnen ein KI-Modell andere Dinge sagen, nur weil es sie in einer anderen Sprache sagt?

Siehe auch No Way Home kehrt im September in die Kinos zurück

Die Antwort liegt in der Tatsache, dass wir diese Systeme verständlicherweise anthropomorphisieren und sie lediglich als Ausdruck eines verinnerlichten Teils von Wissen in der gewählten Sprache betrachten.

Das ist völlig natürlich: Wenn Sie eine mehrsprachige Person bitten würden, eine Frage zunächst auf Englisch und dann auf Koreanisch oder Polnisch zu beantworten, erhalten Sie in jeder Sprache die gleiche Antwort, die genau wiedergegeben wird. Das Wetter heute ist sonnig und kühl, wie auch immer sie es formulieren, denn die Fakten ändern sich nicht, je nachdem, in welcher Sprache sie sie aussprechen. Die Idee ist vom Ausdruck getrennt.

In einem Sprachmodell ist das nicht der Fall, weil sie eigentlich nichts wissen, in dem Sinne, wie Menschen es wissen. Hierbei handelt es sich um statistische Modelle, die Muster in einer Reihe von Wörtern erkennen und anhand ihrer Trainingsdaten vorhersagen, welche Wörter als nächstes kommen.

Erkennen Sie, wo das Problem liegt? Die Antwort ist nicht wirklich eine Antwort, sondern eine Vorhersage darüber, wie diese Frage gestellt wird würde beantwortet werden, wenn es im Trainingssatz vorhanden war. (Hier ist eine längere Untersuchung dieses Aspekts der leistungsstärksten LLMs von heute.)

Obwohl diese Modelle selbst mehrsprachig sind, informieren sich die Sprachen nicht unbedingt gegenseitig. Es handelt sich um überlappende, aber unterschiedliche Bereiche des Datensatzes, und das Modell verfügt (noch) nicht über einen Mechanismus, mit dem es vergleicht, wie sich bestimmte Phrasen oder Vorhersagen zwischen diesen Bereichen unterscheiden.

Wenn Sie also um eine Antwort auf Englisch bitten, greift diese in erster Linie auf alle verfügbaren englischsprachigen Daten zurück. Wenn Sie auf traditionellem Chinesisch nach einer Antwort fragen, stützt sich diese in erster Linie auf die verfügbaren chinesischen Sprachdaten. Wie und in welchem Umfang sich diese beiden Datenmengen gegenseitig beeinflussen oder welches Ergebnis daraus entsteht, ist unklar, aber das aktuelle Experiment von NewsGuard zeigt, dass sie zumindest recht unabhängig sind.

Siehe auch Apple gehört nicht zur Metaverse-Gruppe, die Meta, Microsoft und Sony umfasst

Was bedeutet das für Menschen, die mit KI-Modellen in anderen Sprachen als Englisch arbeiten müssen, das den Großteil der Trainingsdaten ausmacht? Dies ist nur eine weitere Einschränkung, die Sie bei der Interaktion mit ihnen beachten sollten. Es ist schon schwer genug zu sagen, ob ein Sprachmodell richtig antwortet, wild halluziniert oder sogar genau wieder erbricht – und wenn man noch die Unsicherheit einer Sprachbarriere hinzufügt, wird es nur noch schwieriger.

Das Beispiel mit politischen Angelegenheiten in China ist extrem, aber Sie können sich leicht andere Fälle vorstellen, in denen beispielsweise bei der Aufforderung, eine Antwort auf Italienisch zu geben, auf den italienischen Inhalt in seinem Trainingsdatensatz zurückgegriffen und dieser reflektiert wird. Das kann in manchen Fällen durchaus eine gute Sache sein!

Dies bedeutet nicht, dass große Sprachmodelle nur auf Englisch oder in der Sprache, die in ihrem Datensatz am besten repräsentiert wird, nützlich sind. Zweifellos wäre ChatGPT perfekt für weniger politisch belastete Anfragen geeignet, da ein Großteil der Ausgabe gleichermaßen genau ist, unabhängig davon, ob es auf Chinesisch oder Englisch antwortet.

Der Bericht wirft jedoch einen interessanten Punkt auf, der bei der zukünftigen Entwicklung neuer Sprachmodelle berücksichtigt werden sollte: nicht nur, ob Propaganda in der einen oder anderen Sprache stärker präsent ist, sondern auch andere, subtilere Vorurteile oder Überzeugungen. Es bestärkt die Vorstellung, dass es sich immer lohnt, sich selbst (nicht das Modell) zu fragen, woher diese Antwort kommt und ob die Daten, auf denen sie basiert, selbst vertrauenswürdig sind, wenn ChatGPT oder ein anderes Modell Ihnen eine Antwort gibt.

Siehe auch US-Chemieanlagen müssten große Änderungen unter der neuen EPA-Regel vornehmen