Von: Randy DavidVor 2 Minuten

Viber Image 2024 05 04 16 52 49 428
Wird Chatgpt Jemals Aufhören Zu Lernen? 2

Jeder, der sich jemals an chatgpt gewandt hat, um Antworten zu erhalten, hat sich vielleicht irgendwann gefragt, woher dieses beliebte Tool der künstlichen Intelligenz (KI) all die Informationen bezieht, die es bereitstellt. Die einfache Antwort lautet: ChatGPT sammelt unermüdlich alle englischsprachigen Daten, die im offenen Web zu finden sind, und synthetisiert diese für Sie. Alles, was im Internet veröffentlicht wird – von Nachrichtenartikeln bis hin zu digitalen Büchern, Blogs, Podcasts, Dokumentationen, Computerprogrammen usw. – ist Rohmaterial für dieses KI-System.

Die unbefugte Nutzung solcher Inhalte hat Anlass zu Bedenken hinsichtlich einer Verletzung geistiger Eigentumsrechte gegeben. Tatsächlich wurden mehrere Klagen gegen Open AI (den Entwickler von ChatGPT) von Computerprogrammierern, Buchautoren, Verlagen, Nachrichtenorganisationen und verschiedenen anderen Inhaltsproduzenten eingereicht, die ihre gesetzlichen Rechte an urheberrechtlich geschützten Werken geltend machen, auf denen diese leistungsstarken KI-Systeme trainiert werden .

Aber es gibt ein ebenso wichtiges Problem, das viele Beobachter der KI-Welt beunruhigt. Angesichts der ständig wachsenden Rechenleistung, die KI-Systemen heute zur Verfügung steht, ist es nur eine Frage der Zeit, bis das gesamte von Menschen erstellte digitale Material, das möglicherweise im Internet abgebaut werden kann, erschöpft ist. Was werden Unternehmen wie ChatGPT tun, wenn dieser Punkt erreicht ist? Was passiert, wenn sie alle Texte ausgeschöpft haben, an denen sie sich weiterbilden könnten?

Cade Metz, Technologiereporter der New York Times und Autor des Buches „Genius Makers: The Mavericks Who Brought AI to google, Facebook, and the World“, sagt, dass dies tatsächlich bereits geschieht. Um diese zunehmende Knappheit bei der Rohstoffversorgung auszugleichen, hat Open AI damit begonnen, Audio- und Videodateien von verschiedenen Plattformen mithilfe eines von ihm entwickelten Spracherkennungstools zu transkribieren. Die digitalen Transkripte werden dann in ihre maschinellen Lernsysteme eingespeist, um neuere und leistungsfähigere Versionen von ChatGPT zu erstellen.

Siehe auch  ChatGPT: So laden Sie Bilder hoch und analysieren sie

Aber selbst dies könnte nur eine Notlösung sein. Mit der Zeit müssen diese KI-Tools möglicherweise auf nicht-englisches digitales Material im Internet zurückgreifen und dieses in lesbaren englischen Text übersetzen. Laut Matteo Wong in einem Artikel im Atlantic Monthly (12. April 2024) sind „fast 90 Prozent der Websites derzeit in nur 10 Sprachen verfasst (Englisch, Russisch, Spanisch, Deutsch, Französisch, Japanisch, Türkisch, Portugiesisch, Italienisch, und Persisch).“ Es sind diese – und die Weltanschauungen, die sie repräsentieren – die die Welt des Chatbots dominieren werden. Wong glaubt, dass der Rest der 7.000 Sprachen der Welt, insbesondere diejenigen, die nicht von Google Translate unterstützt werden, weiter an den Rand gedrängt werden.

Aber Metz glaubt, dass die Menge an digitalen Inhalten, die Menschen im Internet veröffentlichen können, niemals ausreichen wird, um die praktisch unerschöpfliche Rechenkapazität und den Speicher zu erreichen, der jetzt KI-Systemen zur Verfügung steht. KI-Systeme werden dann keine andere Wahl haben, als sich an maschinengenerierten Inhalten oder „synthetischen Daten“ zu trainieren. Metz glaubt, dass dies eine gefährliche Wende für KI-Chatbots sein könnte, da dadurch die Fehler, die sich aus ihrer Tendenz zur „Halluzination“ oder der Erfindung falscher Informationen ergeben, wenn sie versuchen, menschliche Denkmuster nachzubilden, nur noch verstärkt werden könnten.

Das hört sich alles vielleicht surreal an, aber vielleicht erhaschen wir hier einen Ausblick auf eine vollständig digitalisierte Zukunft mit all ihrem Geschwindigkeitswahn. Sind wir Menschen nur Panikmache? Deshalb habe ich ChatGPT selbst nach seinen eigenen Gedanken zu diesen Themen gefragt. ChatGPT beginnt mit einem Dementi: „Es ist unwahrscheinlich, dass großen Sprachmodellen bald die von Menschen erstellten digitalen Daten ausgehen, aus denen sie lernen können.“ Sollte dies jedoch geschehen, würde die Fähigkeit der Modelle, neue Informationen zu lernen, wahrscheinlich ein Plateau erreichen. Forscher müssten dann alternative Quellen finden oder neue Techniken entwickeln, um die Modelle weiter zu verbessern.“

Siehe auch  ChatGPT – verbieten oder lehren, wie man damit arbeitet?

Ich: „Sind sogenannte synthetische Daten eine dieser Alternativen?“

ChatGPT: „Synthetische Daten sind künstlich generierte Daten, die reale Daten nachahmen, aber von Algorithmen erstellt werden. Es kann verwendet werden, um vorhandene Datensätze zu erweitern oder völlig neue Datensätze für das Training von Modellen für maschinelles Lernen zu erstellen.“

Ich: „Maschinen lernen aus maschinengenerierten Daten? Verstärkt das nicht nur die Fehler, die dabei begangen werden können?“

ChatGPT: „Für Forscher ist es von entscheidender Bedeutung, die Algorithmen zur Generierung synthetischer Daten sorgfältig zu entwerfen und zu validieren, um diese Risiken zu minimieren. Darüber hinaus können die Kombination synthetischer Daten mit realen Daten und der Einsatz strenger Validierungstechniken dazu beitragen, diese Probleme zu mildern. Validierungstechniken für synthetische Daten können Kreuzvalidierung, statistische Analyse, Überprüfung durch Domänenexperten, kontradiktorische Tests und Feinabstimmung umfassen.“

Der Chatbot bot eine weitere Ausarbeitung dieser Validierungsmaßnahmen, von denen die meisten die Form mathematischer Operationen annehmen, die von Maschinen ausgeführt werden. Ich hatte das Gefühl, dass das, was KI-Systeme bieten, nicht die Wahrheit ist, wie wir sie verstehen, sondern ein Modell realer Phänomene.

ChatGPT ist zweifellos äußerst fähig, auf nahezu jede Informations-, Lösungs- oder Beratungsanfrage zu reagieren. Man kann leicht süchtig danach werden und es mit einer echten Person verwechseln, die immer da ist. Aber Vorsicht. Wie Simone de Beauvoir in einer ihrer Figuren im Roman „Les belles images“ warnte: „Bald wird uns die Technologie wie die Natur selbst erscheinen, und wir werden in einer völlig unmenschlichen Welt leben.“

—————-

[email protected]

Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein