Die wichtigsten Konversationsroboter lernen anhand englischer Texte. Daher sind die Antworten in dieser Sprache besser ausdrucksstark und relevanter.
Dieser Artikel stammt aus der Monatszeitschrift Sciences et Avenir – La Recherche Nr. 921 vom November 2023.
„Die Sprachen, die ich erkennen und Texte erzeugen kann, gehen in die Hunderte“, antwortet chatgpt auf die Frage nach seinen Sprachkenntnissen. Aber künstliche Intelligenz (KI) gibt vor: „Mein Niveau an Fähigkeiten und Genauigkeit kann von Sprache zu Sprache stark variieren. „Und tatsächlich haben Forscher der Universität des Baskenlandes (Spanien) gezeigt, dass große Sprachmodelle effizienter sind, wenn die Fragen („Eingabeaufforderungen“) auf Englisch gestellt werden.
Sie bewerteten sieben Derivate von XGLM und LLaMa, Technologien aus dem Labor für künstliche Intelligenz von Meta (Muttergesellschaft von Facebook), indem sie sie an verschiedenen mehrsprachigen Korpora wie XCopa (logisches Denken), PAWS-X (Identifizierung von Paraphrasen) oder MGSM ( Mathematik). Die „Eingabeaufforderungen“ wurden in jeder der von jedem Datensatz berücksichtigten Sprachen verfasst. Andererseits wurden die Antworten auf zwei Arten generiert: Einerseits antwortete das Modell in der Sprache des „Prompts“, andererseits wurde der „Prompt“ vom Modell automatisch ins Englische übersetzt, was dann antwortete auf Englisch.
In Anbetracht der verglichenen Ergebnisse sind die Ergebnisse eindeutig: „Die Modelle sprechen bei allen Aufgaben viel besser Englisch, bemerkt Julen Etxaniz, Sprachverarbeitungsspezialist und Mitautor der Studie. Dadurch werden sogar Übersetzungsfehler ausgeglichen, die bei der Umstellung dieser Modelle von der Originalsprache auf Englisch entstehen. „Haupterklärung, so der Forscher: Diese Technologien werden auf überwiegend englischsprachige Texte trainiert. „Selbst bei den mehrsprachigen Modellen (XGLM und Bloom) sind mehr als 30 % der Trainingsspiele englischsprachig „, fügte Julen Etxaniz hinzu.
Die weit verbreitete englische Wikipedia
OpenAI, das Unternehmen hinter ChatGPT, nutzt die gesamte englischsprachige Wikipedia, einen riesigen Korpus von Webseiten namens C[…]
Lesen Sie mehr auf sciencesetavenir.fr