- Die Leistungsfähigkeit der generativen KI lässt darauf schließen, dass der Mensch schnell ersetzt werden wird.
- Dennoch dient das Lernen von Babys weiterhin als Inspiration für Trainingsmaschinen. Wenn ein 14 Monate altes Baby nicht in der Lage ist, einen Aufsatz wie chatgpt zu schreiben, dominiert es ihn in anderen Bereichen.
- In dieser ersten Folge unserer Serie „Mensch gegen Maschine“ beschäftigen wir uns mit dem Sprachenlernen.
„Mama“, „Papa“, „Baby“ … Mit nur 14 Monaten lernte mein Baby, etwa zehn Wörter zu plappern und unermüdlich „Nein“ zu wiederholen. Man könnte erwarten, dass er bei jeder neuen Ergänzung seines Wortschatzes eine Träne vergießt (wir müssen zugeben, dass sein erster „Kacken“ applaudiert wurde). Tatsächlich nehmen wir die Neuankömmlinge kaum wahr, die wie Armande Altaï in Diktionsübungen versunken sind Sternenakademie (Ära 2001, nehmen wir an). Mitten in der Suppe „dibiditapatoutabouba“ wirkt „Vogel“ wie ein glücklicher Zufall.
Als ich beobachtete, wie mein Baby beim Aufwachen sehr früh am Morgen schmerzhaft „ta“ für „Katze“ stammelte, fiel mir ein Treffen im Jahr 2018 mit Yann Le CunForschungsdirektor in künstliche Intelligenz chez Meta (Fair), wo dieser Pionier des Deep Learning erklärte, dass er mit dem auf Säuglingslernen spezialisierten Neurolinguisten Emmanuel Dupoux zusammenarbeitete, um zu versuchen, die Geheimnisse der Lernfähigkeit von Babys zu lüften. Die Idee ist, dass die Inspiration durch Babys die Schaffung einer effizienteren KI ermöglichen würde. Ein Kind braucht etwa drei Jahre, um eine komplexe Sprache zu entwickeln. Wo stünde die Maschine nach 14 Monaten Einarbeitung? Würde mein Baby im Ring des Sprechenlernens von den aktuellen Algorithmen mit einem Aufwärtshaken belegt werden oder im Gegenteil Sprachmodelle ausschalten? ChatGPT entwickelt von OpenAI ?
„Hund“ oder „Choin“?
„Die menschliche Sprache ist von beispielloser Komplexität und der einzige Akteur, der Sprache effektiv lernt, ist das Baby“, erklärt Marvin Lavechin, Spezialist für künstliche Intelligenz und Spracherwerbsmodelle, der im Team von Emmanuel Dupoux arbeitete. Bevor sich das Baby in einer komplexen Sprachform ausdrücken kann, durchläuft es universelle Phasen. „Das Kind produziert zuerst Vokale, dann Silben, deren Aussprache aus Sicht der Mundmotorik schwieriger ist“, erklärt Séverine Alonso-Bekier, Psychomotoriktherapeutin. Anschließend ordnet er die Silben zusammen und beginnt, die Wörter zu einem Satz zu bilden. Mit drei Jahren beherrscht das Kind komplexe Sprache, strukturierte Sätze sowie Vorstellungen von Raum und Zeit. Es bezeichnet nicht nur ein Objekt. „Er wird sagen: ‚Mein Spielzeug im Schlafzimmer‘.“ Er beherrscht eine Reihe von Parametern“, fährt sie fort.
Man könnte denken, dass drei Jahre zum Erlernen der Sprache eine lange Zeit sind. Stellen Sie sich in Wirklichkeit vor, Sie wären drei Jahre lang in Japan eingetaucht. Ohne ein Wörterbuch oder einen Übersetzer werden Sie nicht zweisprachig. Sie werden kaum in der Lage sein, bestimmte Geräusche zu unterscheiden und andere zu verstehen. Große kognitive Leistung des Kindes. Außer, dass ChatGPT weiß, wie man eine philosophische Dissertation auf Bachelor + 5-Niveau schreibt, ein Plädoyer, eine politische Rede … Das gelingt ihm sogar Wettbewerb um die wichtigsten Schulen. Ein Dreijähriger macht nichts davon. Noch weniger mein 14 Monate altes Baby, das seinen Vater jedes zweite Mal „Mami“ nennt. Ist das Spiel schon vorbei? Nicht so schnell.
Ein Wort zu kennen bedeutet viele Dinge: einen Laut einem Objekt zuordnen, wissen, dass das Wort „Hund“ das Tier darstellt; oder wissen, wie man erkennt, dass das Wort „Hund“ französisch ist, ohne es unbedingt zu verstehen. „Wir haben Tests gemacht. Wir geben dem Algorithmus das Wort „Hund“ und ein Wort, das wie ein französisches Wort klingt, aber keins ist, zum Beispiel „choin“. Erkennt der Algorithmus, dass das Wort „Hund“ zur französischen Sprache gehört? Wir wissen, dass sie exponentiell langsamer lernen als Kinder“, erklärt Marvin Lavechin. Sie benötigen unendlich mehr Daten, um zum gleichen Ergebnis zu gelangen. „Zwischen der Lerngeschwindigkeit von Babys und der von KI liegt ein Ozean“, beobachtet der Forscher. Sogar die Daten, auf denen Babys lernen, sind viel komplexer.
Eine langsame und logiklose Maschine
Heutzutage werden die Algorithmen auf Hörbücher trainiert, sehr artikulierte Wörter, ohne parasitäre Geräusche oder Klangvariationen. Im Gegenteil: Ein Kind lernt in einer lauten Umgebung, in der zwei Diskussionen gleichzeitig stattfinden können und in der äußere Geräusche die Stimmen übertönen. Manchmal spreche ich in der Küche mit meinem Baby, während neben ihm eine New-Order-Platte knistert. In Gegenwart eines anderen Erwachsenen nehme ich mir nicht immer die Zeit, mich so zu artikulieren, wie ich es alleine mit ihm tun würde. Ist eine Maschine mit dieser Art von Daten vertraut?
Tatsächlich versuchten die Forscher, die KI in die gleiche Lernposition zu bringen wie das Baby. Forscher platzierten Mikrofone bei sehr kleinen Kindern im Alter von 0 bis zwei oder drei Jahren und sammelten die gesamte Sprache, die das Kleinkind im Laufe des Tages aufnahm. „Wir haben diese Daten abgerufen und unsere Lernmodelle anhand dieser Aufzeichnungen trainiert“, erklärt Marin Lavechin. Der Algorithmus kommt mit allen möglichen Situationen zurecht: Eine Mutter erzählt ihrem Kind eine Geschichte, die Sprache ist sehr nah und deutlich; Eine Mutter redet, während im Hintergrund der Fernseher läuft. An diesen Daten „brechen sich die Algorithmen meisterhaft die Zähne aus“, schmunzelt der KI-Spezialist.
Mit ein paar Jahren wissen Kinder intuitiv, wie man Verben konjugiert, sie erwerben die Grundlagen der Physik, indem sie die Welt beobachten. „Nach zwei Monaten verstehen Babys die Vorstellung von der Beständigkeit von Objekten. Wenn ein Objekt ausgeblendet ist, ist es nicht verschwunden. In der Zwischenzeit mussten sie verstehen, dass die Welt dreidimensional ist, dass Objekte vor anderen Objekten liegen können. Im Alter von etwa 8 Monaten verstehen sie, dass ein Gegenstand, der nicht unterstützt wird, herunterfallen wird. „Schwerkraft, der Effekt der Trägheit…“, betonte Yann Le Cun während dieser Diskussion. Heutige Maschinen wissen, wie man Sprache und Texte produziert – nachdem sie mit gigantischen Datenmengen trainiert wurden –, verfügen jedoch nicht über die geringste grundlegende Logik. Müssen wir angeben, wer als Sieger aus dem Kampf hervorgeht?