Start ChatGPT Warum entwickelt Japan eine eigene Version von ChatGPT?

Warum entwickelt Japan eine eigene Version von ChatGPT?

Von

September 17, 2023

Text/Cai Xianjing Einige japanische Forscher glauben, dass auf Fremdsprachen trainierte künstliche Intelligenzsysteme die Komplexität der japanischen Sprache und Kultur nicht erfassen können. Tim Hornyak veröffentlichte in der neuesten Ausgabe von „Nature“ (Warum Japan seine eigene Version von chatgpt baut), dass Japan seine eigene Version von ChatGPT baut. ChatGPT, ein Chatbot mit künstlicher Intelligenz (KI) des US-Unternehmens OpenAI, sorgte weltweit für Aufsehen Sensation nach dem Start vor weniger als einem Jahr. KI-Systeme können die Komplexität der japanischen Sprache und Kultur nicht erfassen Die japanische Regierung und große Technologieunternehmen wie NEC, Fujitsu und SoftBank investieren Hunderte Millionen Dollar in die Entwicklung künstlicher Intelligenzsysteme, die auf derselben zugrunde liegenden Technologie, großen Sprachmodellen (LLMs), basieren, jedoch in japanischen statt in englischen Übersetzungen. Keisuke Sakaguchi, ein Forscher für natürliche Sprache an der Tohoku-Universität in Japan, sagte: „Aktuelle öffentliche Rechtsexperten wie GPT schneiden auf Englisch gut ab, schneiden aber auf Japanisch aufgrund von Unterschieden in den Alphabetsystemen, begrenzten Daten und anderen Faktoren oft schlecht ab.“ . Rechtsexperten nutzen oft große Datenmengen aus öffentlichen Quellen, um Muster in natürlicher Sprache und Prosa zu lernen. Sie werden darauf trainiert, das nächste Wort anhand vorheriger Wörter in einem Text vorherzusagen. Die überwiegende Mehrheit der Texte, die mit dem Vorgängermodell von ChatGPT, GPT-3, trainiert wurden, waren auf Englisch. Die bizarre Fähigkeit von ChatGPT, menschenähnliche Gespräche zu führen, erfreut und beunruhigt Forscher gleichermaßen. Einige sehen darin ein potenziell arbeitssparendes Werkzeug, andere befürchten, dass es zur Fälschung wissenschaftlicher Arbeiten oder Daten verwendet werden könnte. In Japan gibt es Bedenken, dass KI-Systeme, die auf Datensätzen aus anderen Sprachen trainiert werden, nicht in der Lage sein werden, die Komplexität der japanischen Sprache und Kultur zu erfassen. Der japanische Satzaufbau unterscheidet sich völlig vom englischen. Daher muss ChatGPT die japanische Anfrage ins Englische übersetzen, die Antwort finden und dann die Antwort zurück ins Japanische übersetzen. Englisch hat nur 26 Buchstaben, während geschriebenes Japanisch aus zwei Sätzen mit 48 Grundzeichen sowie 2.136 häufig verwendeten Kanji oder Kanji besteht. Die meisten chinesischen Schriftzeichen haben zwei oder mehr Aussprachen und es gibt etwa 50.000 selten verwendete Schriftzeichen. Angesichts dieser Komplexität ist es nicht verwunderlich, dass ChatGPT Probleme mit der Sprache hat. ChatGPT muss kulturelle Praktiken und Sprache genau widerspiegeln Auf Japanisch erzeugt ChatGPT „manchmal extrem seltene Zeichen, die die meisten Menschen noch nie zuvor gesehen haben, und führt zu seltsamen, unbekannten Wörtern“, sagte Sakaguchi. Damit die Rechtsprechung nützlich oder sogar wirtschaftlich rentabel ist, muss sie kulturelle Praktiken und Sprache genau widerspiegeln. Wenn ChatGPT beispielsweise aufgefordert wird, eine Bewerbungs-E-Mail auf Japanisch zu verfassen, werden möglicherweise standardmäßige Höflichkeitsformeln weggelassen und es sieht aus wie eine offensichtliche englische Übersetzung. Um zu messen, wie sensibel Rechtsexperten auf die japanische Kultur reagieren, hat ein Forscherteam Rakuda ins Leben gerufen, ein Ranking, das messen soll, wie gut Rechtsexperten offene Fragen zu japanischen Themen beantworten. Rakuda-Mitbegründer Sam Passaglia und seine Kollegen baten ChatGPT, die Fließfähigkeit und kulturelle Angemessenheit von Standard-Eingabeantworten zu vergleichen. Sie nutzten das Tool, um die Ergebnisse auf der Grundlage eines im Juni veröffentlichten Vorabdrucks zu bewerten, der zeigte, dass GPT-4 in 87 % der Fälle mit den Ergebnissen menschlicher Gutachter übereinstimmte. Das beste Open-Source-LLM in Japan belegt bei Rakuda den vierten Platz, und GPT-4, das den ersten Platz belegt, ist vielleicht nicht überraschend, da es auch als Juror der Konkurrenz fungiert. „Natürlich werden japanische Rechtsexperten immer besser, aber sie liegen weit hinter GPT-4 zurück“, sagte Pasalia, ein Physiker an der Universität Tokio, der japanische Sprachmodelle studiert. Er sagte jedoch, dass es grundsätzlich keinen Grund zu der Annahme gebe, dass Japans LLM in Zukunft nicht GPT-4 erreichen oder übertreffen könne. „Es ist nicht technisch unüberwindbar, es ist nur eine Frage der Ressourcen.“ Schaffung einer japanischen KI, die an wissenschaftliche Bedürfnisse angepasst ist Ein großer Aufwand bei der Schaffung eines Experten für japanische Grammatik bestand darin, den japanischen Supercomputer Fugaku, einen der schnellsten Computer der Welt, zu nutzen, um ihn hauptsächlich für japanische Eingaben zu trainieren. Der daraus resultierende juristische Facharztabschluss wird voraussichtlich im nächsten Jahr veröffentlicht, mit Unterstützung des Tokyo Institute of Technology, der Tohoku University, Fujitsu und der staatlich finanzierten RIKEN Research Center Group. Im Gegensatz zu GPT-4 und anderen proprietären Modellen wird es zusammen mit anderen Open-Source-Rechtsexperten seinen Code allen Benutzern zugänglich machen. Laut Sakaguchi, der an dem Projekt beteiligt ist, hofft das Team, ihm mindestens 30 Milliarden Parameter zu geben, das sind Werte, die seine Leistung beeinflussen und als Maß für seinen Umfang verwendet werden können. Möglicherweise wird Fugaku jedoch von einem größeren Rechtsexperten abgelöst. Das japanische Ministerium für Bildung, Kultur, Sport, Wissenschaft und Technologie finanziert die Schaffung eines japanischen Projekts für künstliche Intelligenz, das an wissenschaftliche Bedürfnisse angepasst ist und durch Lernen aus veröffentlichten Forschungsergebnissen wissenschaftliche Hypothesen generieren soll, um die Identifizierung von Untersuchungszielen zu beschleunigen. Das Modell kann mit 100 Milliarden Parametern beginnen, was etwas mehr als der Hälfte der Größe von GPT-3 entspricht, und wird im Laufe der Zeit skaliert. „Wir hoffen, den wissenschaftlichen Forschungszyklus deutlich zu beschleunigen und den Suchraum zu erweitern“, sagte Makoto Taiji, stellvertretender Direktor des Biological System Dynamics Research Center am RIKEN, über das Projekt. Die Entwicklung von LLM wird mindestens 30 Milliarden Yen (204 Millionen US-Dollar) kosten und voraussichtlich im Jahr 2031 öffentlich eingeführt werden. Investition von 20 Milliarden Yen in KI, die mit japanischen Texten trainiert wird Andere japanische Unternehmen haben ihre eigene juristische Expertise bereits kommerzialisiert oder planen dies. Der Supercomputer-Hersteller NEC begann im Mai mit der Nutzung seiner in Japan ansässigen generativen KI und gab an, den Zeitaufwand für die Erstellung interner Berichte um 50 % und den Zeitaufwand für die Erstellung von Quellcode für interne Software um 80 % reduziert zu haben. Im Juli begann das Unternehmen, seinen Kunden anpassbare generative KI-Dienste anzubieten. Es kann „in einer Vielzahl von Branchen wie Finanzen, Transport und Logistik, Vertrieb und Fertigung eingesetzt werden“, sagte Masafumi Oyamada, leitender Forschungsleiter am Data Science Laboratory des NEC. Forscher können es für Aufgaben wie das Schreiben von Code, das Helfen beim Verfassen und Bearbeiten von Artikeln sowie die Untersuchung vorhandener veröffentlichter Artikel verwenden, fügte er hinzu. Unterdessen investiert das japanische Telekommunikationsunternehmen SoftBank rund 20 Milliarden Yen in generative künstliche Intelligenz, die auf japanischen Texten trainiert wird, und plant, im nächsten Jahr eigene Rechtsexperten auf den Markt zu bringen. SoftBank, das 40 Millionen Kunden hat und eine Partnerschaft mit dem OpenAI-Investor Microsoft unterhält, sagte, es wolle Unternehmen dabei helfen, ihre Geschäfte zu digitalisieren und die Produktivität zu steigern. SoftBank erwartet, dass seine Rechtsexpertenkurse von Universitäten, Forschungseinrichtungen und anderen Organisationen genutzt werden. Einen positiven Einfluss auf die internationale Gemeinschaftsforschung nehmen Unterdessen hoffen japanische Forscher, dass präzise, effektive, in Japan hergestellte Chatbots mit künstlicher Intelligenz dazu beitragen können, den wissenschaftlichen Fortschritt zu beschleunigen und die Lücke zwischen Japan und dem Rest der Welt zu schließen. „Wenn die japanische Version von ChatGPT genau sein kann, wird sie voraussichtlich bessere Ergebnisse für Menschen liefern, die Japanisch lernen oder japanische Forschung betreiben möchten“, sagte Shotaro Kinoshita, Medizintechnikforscher an der Keio University School of Medicine in Tokio. „Daher kann es sich positiv auf die internationale gemeinsame Forschung auswirken.“

Siehe auch Der Schöpfer von „Black Mirror“ sagt, er habe ChatGPT genutzt, um zu versuchen, eine Episode der Serie zu schreiben