Der Hype, der auf ChatGPTs folgte chatgpt-ish-artificial-intelligence“>öffentlicher Start Das letzte Jahr war selbst für technische Innovationen extrem. OpenAIs natürliches Sprachsystem erstellt Rezepte, schreibt Computercode und parodiert literarische Stile. Seine neueste Version kann sogar Fotos beschreiben. Es wurde als technologischer Durchbruch gefeiert, der mit der Druckerpresse vergleichbar sei. Aber es dauerte nicht lange, bis auch große Mängel zutage traten. Manchmal „halluziniert“ es Nicht-Fakten, die es mit absoluter Überzeugung ausspricht, und beharrt auf diesen Unwahrheiten, wenn man es fragt. Außerdem fällt es bei grundlegenden Logiktests durch.
Mit anderen Worten: ChatGPT ist kein allgemeines künstliche Intelligenzsondern eine unabhängige Denkmaschine. Es ist, im Fachjargon, ein großes Sprachmodell. Das heißt, es ist sehr gut darin, vorherzusagen, welche Arten von Wörtern tendenziell auf welche anderen folgen, nachdem es anhand einer riesigen Textmenge trainiert wurde – sein Entwickler, OpenAI, sagt nicht genau, woher – und Muster zu erkennen.
Inmitten des Hypes kann man leicht ein kleines Wunder vergessen. ChatGPT hat sich einem Problem gestellt, das für Ingenieure lange Zeit ein Traum war: die Generierung menschenähnliche Sprache. Anders als frühere Versionen des Systems kann es dies über Absätze hinweg tun, ohne in Inkohärenz zu verfallen. Und die Dimensionen dieser Leistung sind noch größer, als sie auf den ersten Blick erscheinen. ChatGPT ist nicht nur in der Lage, bemerkenswert realistisches Englisch zu generieren. Es ist auch in der Lage, sofort Text in mehr als 50 Sprachen auszusprechen – die genaue Zahl ist dem System selbst anscheinend unbekannt.
Auf die Frage (auf Spanisch), wie viele Sprachen es sprechen kann, antwortet ChatGPT vage: „mehr als 50“ und erklärt, dass seine Fähigkeit, Text zu produzieren, davon abhängt, wie viele Trainingsdaten für eine bestimmte Sprache verfügbar sind. Dann bietet es auf eine Frage in einem unangekündigten Wechsel auf Portugiesisch eine Skizze der Biografie Ihres Kolumnisten in dieser Sprache an. Das meiste davon war richtig, aber er studierte das falsche Fach an der falschen Universität. Die Sprache selbst war einwandfrei.
Portugiesisch ist eine der größten Sprachen der Welt. Ihr Kolumnist hat ChatGPT in einer kleineren Sprache getestet und zwar auf Dänisch, das nur von etwa 5,5 Millionen Menschen gesprochen wird. Dänen schreiben einen Großteil ihrer Online-Texte auf Englisch, daher müssen die Trainingsdaten für Dänisch um Größenordnungen spärlicher sein als die für Englisch, Spanisch oder Portugiesisch. Die Antworten von ChatGPT waren sachlich falsch, aber in nahezu perfektem Dänisch ausgedrückt. (Ein winziger Fehler bei der Geschlechtsübereinstimmung war der einzige Fehler, der in allen getesteten Sprachen gefunden wurde.)
Tatsächlich ist ChatGPT zu bescheiden, was seine eigenen Fähigkeiten angeht. Auf Anfrage liefert es eine Liste von 51 Sprachen, in denen es arbeiten kann, darunter Esperanto, Kannada und Zulu. Es lehnt es ab, zu sagen, dass es diese Sprachen „sprechen“ kann, sondern „Texte in ihnen generiert“. Das ist eine zu bescheidene Antwort. Auf Katalanisch angesprochen – eine Sprache, die nicht auf der Liste steht – antwortet es in dieser Sprache mit einem fröhlichen „Ja, ich spreche Katalanisch – wie kann ich Ihnen helfen?“. Ein paar Nachfragen bringen es nicht im Geringsten aus der Fassung, darunter eine Frage, ob es lediglich Antworten übersetzt, die zuerst in einer anderen Sprache generiert wurden, ins Katalanische. Dies bestreitet ChatGPT: „Ich übersetze nicht aus anderen Sprachen; ich suche in meiner Datenbank nach den besten Wörtern und Ausdrücken, um Ihre Fragen zu beantworten.“
Wer weiß, ob das stimmt? ChatGPT denkt sich nicht nur Dinge aus, sondern beantwortet Fragen zu dem Gespräch, das es gerade führt, auch falsch. (Es hat kein „Gedächtnis“, sondern speist die letzten paar tausend Wörter jedes Gesprächs als neue Eingabeaufforderung in sich selbst ein. Wenn Sie eine Weile Englisch gesprochen haben, wird es „vergessen“, dass Sie zuvor eine Frage auf Dänisch gestellt haben, und sagen, dass die Frage auf Englisch gestellt wurde.) ChatGPT ist nicht nur in Bezug auf die Welt, sondern auch in Bezug auf sich selbst nicht vertrauenswürdig.
Dies sollte jedoch nicht die Leistung eines Modells überschatten, das so viele Sprachen mühelos nachahmen kann, auch solche mit begrenzten Trainingsdaten. Sprecher kleinerer Sprachen sind seit Jahren besorgt, dass die Sprachtechnologie an ihnen vorbeiziehen könnte. Ihre berechtigte Sorge hatte zwei Ursachen: den geringeren Anreiz für Unternehmen, Produkte auf Isländisch oder Maltesisch zu entwickeln, und den relativen Mangel an Daten, um sie zu trainieren.
Irgendwie scheinen die Entwickler von ChatGPT solche Probleme überwunden zu haben. Es ist zu früh zu sagen, was gut Die Technologie reichen, aber das allein ist schon ein Grund, optimistisch zu sein. Wenn sich die Techniken des maschinellen Lernens verbessern, werden sie vielleicht nicht mehr die enormen Ressourcen an Programmierzeit oder Daten erfordern, die traditionell als notwendig angesehen wurden, um sicherzustellen, dass kleinere Sprachen online nicht übersehen werden.
© 2023, The Economist Newspaper Limited. Alle Rechte vorbehalten. Von The Economist, veröffentlicht unter Lizenz. Der Originalinhalt ist auf www.economist.com zu finden.