Forscher der Polytechnischen Universität Madrid haben bestätigt, dass chatgpt 20 % der spanischen Sprache nicht beherrscht. Von den 80 % des Wortschatzes, die es erkennt, interpretiert es in 5 % der Fälle falsche Bedeutungen. Der Zustand stellt die Zuverlässigkeit und die wahren Fähigkeiten des Volkes in Frage Chatbot.
Die Studie nutzte eine Open-Source-Anwendung namens „ChatWords“. Das Tool analysierte die Fähigkeit des von OpenAI entwickelten Algorithmus, fast 90.000 Wörter im Wörterbuch der Royal Spanish Academy zu verstehen und korrekt zu verwenden. ChatGPT3.5 Turbo kennt ein Fünftel der untersuchten Begriffe nicht, also rund 18.000 Wörter. Die Studie zeigt, dass ein Spanisch sprechender Mensch im Durchschnitt 30.000 Wörter erkennt, also ein Drittel der spanischen Sprache.
Javier Conde, Co-Autor der Arbeit, erklärt: „Bei der Analyse der Bedeutungen, die ChatGPT für Wörter bietet, stellen wir fest, dass es einen nicht zu vernachlässigenden Prozentsatz gibt, bei dem die Bedeutung falsch ist.“ Vielleicht ist ChatGPT nicht so klug, wie es scheint.“
Auf künstlicher Intelligenz (KI) basierende Large Language Models (LLMs), die für die Verarbeitung natürlicher Sprache entwickelt wurden, vermeiden die Verwendung von Wörtern, die sie nicht erkennen, um ihre Antworten zu formulieren. Pedro Reviriego, Co-Autor der Studie, weist darauf hin, dass unter dieser Bedingung ein Szenario, in dem der neu generierte Inhalt eine immer geringere Anzahl verschiedener Wörter enthält, „sehr machbar“ sei. Die Folge ist eine lexikalische Knappheit.
Sprache ist der Rohstoff für die Weiterentwicklung der KI
Elena González Blanco, CEO und Mitbegründerin von Clibrain, gibt an, dass KI im Jahr 2016 begann, korrekt mit der Bildverwaltung zusammenzuarbeiten. Mit der Verbesserung neuronaler Netze haben intelligente Modelle begonnen, ihre Leistung im Bereich der Sprache zu verbessern. Die Entwicklungsphase ist früh. „Die künstliche Intelligenz hat sich stark verbessert, aber es gibt noch viel zu perfektionieren. in unserer Sprache [español]„Die Technologie hat ein offenes Problem.“
Nach Angaben des Cervantes-Instituts gibt es weltweit 500 Millionen Spanischsprecher. Spanisch ist weltweit die zweite Muttersprache und Es ist die am dritthäufigsten verwendete Sprache im Internet, nur hinter Englisch und Chinesisch. 7,5 % der Weltbevölkerung sind potenzielle Lexikonnutzer.
„Wir befinden uns jedoch in einer Welt, in der generative Modelle der künstlichen Intelligenz auf Englisch geboren, auf Englisch trainiert und einfach in verschiedene Sprachen übersetzt wurden. Trotz der großen Zahl spanischsprachiger Menschen auf der Welt gibt es nur wenige Technologien, die sich auf unsere Sprache konzentrieren“, sagt González Blanco.
Das Phänomen droht, die bestehende Voreingenommenheit im globalen Handel und in der Innovation zu verstärken. Menschen, die Spanisch sprechen, können einen Gewinn von fast 10 % des weltweiten Bruttoinlandsprodukts (BIP) erwirtschaften. Der Markt ist besonders attraktiv für die aufstrebende KI-Branche.
Pascale Fung, Direktorin des Forschungszentrums für künstliche Intelligenz an der Hong Kong University of Science and Technology, stellt sich hingegen eine vielversprechende Zukunft vor, in der mehrsprachige Assistenten für künstliche Intelligenz wie ChatGPT Sprachbarrieren beseitigen. Geschieht dies nicht, wären Käufe und die übrigen KI-unterstützten Aktivitäten einseitig, warnt der Wissenschaftler.