Die wichtigsten Informationen (Klicken Sie hier, um zu gehen)

Wie verwende ich einen von Elon Musk erstellten Chatbot? Suchen Sie die chatgpt-Website, melden Sie sich an, geben Sie eine Frage in das Feld ein und warten Sie einige Sekunden, bis die künstliche Intelligenz (KI) die Antwort generiert. Der Text, den Sie erhalten, ist möglicherweise auf Polnisch, die automatische (wenn auch intelligente) Übersetzung kann jedoch Sprachfehler enthalten. Scheinbar einfach. Damit die Antwort generiert werden kann, benötigen Sie:

  • ein System, das über maschinelle Lernfähigkeiten verfügt;
  • riesige Menge qualitativ hochwertiger Daten;
  • ein Chatbot, der natürliche Sprache (d. h. die von Menschen gesprochene Sprache) effizient nutzt;
  • Geräte mit hoher Rechenleistung;
  • beträchtliche Mittel, um die Stromrechnung zu bezahlen.

Der letzte Punkt ist kein Scherz:

– Die Pflege des Sprachmodells und vor allem die Datenverarbeitung verbraucht viel Energie – sagt Dr. Tomasz Walkowiak von der Abteilung für Künstliche Intelligenz an der Technischen Universität Breslau. Er fügt hinzu: – Auf der besten Grafikkarte auf dem Markt dauert es 70 Sekunden, bis eine Aussage mit 1.000 Wörtern gezählt ist. Deshalb ist Energie ein Problem.

Das tolle polnische Sprachmodell – für die Benutzersicherheit

ChatGPT ist Teil eines großen Sprachmodells, das auf maschinellem Lernen basiert. Die Technologie wurde von der amerikanischen Organisation OpenAI entwickelt, die von Elon Musk gegründet wurde. Einen Monat nach dem Start am 30. November 2022 hatte ChatGPT 57 Millionen Nutzer und im Januar dieses Jahres, zwei Monate nach dem Start, bereits 590 Millionen Besuche.

Allerdings ist es nicht die Zahl der Nutzer, sondern der Umfang des KI-Einsatzes in der Wirtschaft, der schockiert. Es gibt wahrscheinlich keinen Bereich, der nicht von den Möglichkeiten der KI in Versuchung geführt würde. Künstliche Intelligenz wird von kleineren und größeren privaten und öffentlichen Unternehmen, verschiedenen Arten von Organisationen und normalen Benutzern genutzt.

Siehe auch  Neuer ChatGPT-Test ermöglicht Mitgliedern die Analyse von Dateien – Channelnews

Stellen Sie sich nun vor, dass OpenAI den Zugang zur Technologie abschneidet.

– Wir sehen einen großen Bedarf an der Schaffung eines gut gesicherten polnischen Sprachmodells, damit es eine sichere Basis für Unternehmer, Verwaltung, Wissenschaftler und normale Benutzer darstellt – sagt Dr. Jan Kocoń von der Abteilung für Künstliche Intelligenz an der Universität für Wissenschaft und Technologie Breslau . – Wir müssen diese Technologie unter Kontrolle haben, allein schon für die Sicherheit der generierten Texte.

Was bedeutet das in der Praxis? Blockierung von KI-generierten Fake News und Hass, Schutz der persönlichen Daten der Nutzer und Unterbindung des illegalen Datenhandels. Um die Sicherheit zu gewährleisten, brauchen wir nicht nur entsprechende Vorschriften (an denen die Europäische Union bereits arbeitet), sondern auch die Kontrolle über das Modell selbst.

Künstliche Intelligenz verarbeitet, was wir ihr geben

Ein großes, auf maschinellem Lernen basierendes Sprachmodell verarbeitet die ihm zugeführten Daten. Das heißt: Je mehr hochwertige Informationen bei der KI ankommen, desto bessere Antworten generiert das System.

Die Technische Universität ist seit 10 Jahren Mitglied des paneuropäischen Wissenschaftskonsortiums Clarin-pl, Dies ermöglicht Forschern in den Geistes- und Sozialwissenschaften die Arbeit mit sehr großen Textsammlungen. Aber es ist immer noch nicht genug.

Dass es nicht so einfach ist, wertvolle Daten zu erhalten, auf denen das Modell lernen könnte, beweisen Tests, die von Wissenschaftlern im Dekanat der Breslauer Universität für Wissenschaft und Technik durchgeführt wurden. Die Mitarbeiter des Dekanats beantworten, wie Dr. Tomasz Walkowiak erklärt, täglich Dutzende Fragen. In vielen Fällen könnte dieser Prozess automatisiert werden, aber das System verfügt nicht über genügend qualitativ hochwertige Daten. Sie können nicht aus dem Internet bezogen werden, da viele Informationen veraltet sind. Und wie sich herausstellt, haben die Daten die beste Datenqualität, die existieren – in den Köpfen der Mitarbeiter des Dekanats.

Siehe auch  Tipps und Tricks zu Chatgpt: 11 Tipps und Tricks zum Erstellen hervorragender ChatGPT-Eingabeaufforderungen

Auch künstliche Intelligenz braucht Disziplin

Daten bereitzustellen ist eine Sache, der KI beizubringen, sie zu verarbeiten, eine ganz andere. Wie Dr. Tomasz Walkowiak erklärt, lernt künstliche Intelligenz durch die Methode der Belohnung und Bestrafung.

Zur Beurteilung der Qualität der von der KI bereitgestellten Antwort wird ein spezielles Modell erstellt.

Dr. Tomasz Walkowiak

Dies ist notwendig, da es im Internet, der Hauptdatenquelle für KI, viele falsche und qualitativ minderwertige Informationen gibt. Der Chatbot muss außerdem lernen, ein auf den Empfänger zugeschnittenes Vokabular zu verwenden und beleidigende und diskriminierende Formulierungen zu vermeiden.

Kultur vor dem Vergessen bewahren

Sobald KI weit verbreitet ist – und daran zweifelt niemand – werden die Daten, die KI verarbeiten wird, für die allgemeine Nutzung verfügbar sein. Wenn ihr niemand Informationen über die polnische Kultur, Wissenschaft und Literatur liefert, geht dieses Wissen verloren.

– Offene Sprachmodelle werden derzeit hauptsächlich auf Daten in zwei Sprachen trainiert: Englisch und Chinesisch; 49 Prozent der Daten sind auf Englisch, 49 Prozent auf Chinesisch. Die restlichen zwei Prozent entfallen auf die übrigen Sprachen der Welt, sagt Dr. Tomasz Walkowiak.

Wo bleibt bei alledem die polnische Sprache? Natürlich können wir unsere Kultur vergessen, aber das wäre schade.

Dr. Tomasz Walkowiak

Wie der Wissenschaftler versichert, wird das polnische Sprachmodell zur Erhaltung unserer Kultur beitragen. Darüber hinaus kann es von Wissenschaftlern, Unternehmern, gemeinnützigen Organisationen und Ärzten genutzt werden; an alle, die Nachrichten senden.

In welcher Sprache denkt künstliche Intelligenz?

Das Sprachmodell besteht aus einem System, das Informationen aus verfügbaren Texten extrahiert, und ChatGPT, das eine Aussage in einer natürlichen Sprache erstellt.

– ChatGPT ist kein wissensbasiertes Tool – warnt Dr. Tomasz Walkowiak. – Er verwendet nur schöne natürliche Sprache.

Und auf Englisch, was die Standardoption für Elon Musks Chatbot ist. Obwohl das System auf Polnisch funktionieren kann, handelt es sich um eine Übersetzung voller Unbeholfenheit und sogar sprachlicher Fehler.

Siehe auch  Apple entwickelt seinen eigenen Chatbot, um mit ChatGPT von OpenAI zu konkurrieren

– Wir möchten ein für jedermann zugängliches Modell erstellen, das unsere Sprache gut widerspiegelt – sagt Dr. Tomasz Kajdanowicz von der Abteilung für Künstliche Intelligenz an der Universität für Wissenschaft und Technologie Breslau.

Für Wissenschaftler ist das ein wichtiges Argument, denn sie sehen, wie Sprachmodelle die natürliche Sprache prägen, etwa weil KI immer mehr Inhalte im Internet generiert.

– Dank unseres Modells wird die polnische Sprache in einem neuen Kontext verwendet und weiterleben – betont Dr. Hab. Maciej Piasecki von der Abteilung für Künstliche Intelligenz an der Universität für Wissenschaft und Technologie Breslau.

Was ist und was fehlt, um einen Chatbot in der polnischen Sprachversion zu erstellen?

Die Entwicklung der KI ist in der neuen Strategie der Universität als wichtigste Richtung in der Entwicklung der wissenschaftlichen Forschung enthalten.

Die Informationsbeschaffung hat bereits begonnen, reicht aber noch nicht aus. Wir planen die Zusammenarbeit mit Institutionen und Unternehmen. Allerdings könnte die Datenerfassung bald komplizierter werden, da die Europäische Union an Vorschriften für KI und ihre Anwendungen arbeitet:

– In seiner aktuellen Version geht das Projekt davon aus, dass alle zum Training des Sprachmodells verwendeten Daten unter einer entsprechenden Lizenz zur Verfügung gestellt werden müssen, was das aktuelle ChatGPT nicht erfüllt, und dass alle Quellen bekannt sein müssen, was ChatGPT tut auch nicht treffen. Sollten die Vorschriften in Kraft treten, wird die Datenerhebung eine Herausforderung sein. „Wir hoffen, dass die endgültigen Bestimmungen milder ausfallen“, sagt Jan Kocoń.

Wissenschaftler warten derzeit auf einen Computercluster:

– Clarin-pl bringt einen der ersten polnischen Supercomputer für natürliche Sprachverarbeitung und KI mit sehr hoher Rechenleistung auf den Markt. Es wird mit über 300 der neuesten Prozessoren ausgestattet sein – sagt Prof. Maciej Piasecki.

Es stellt sich heraus, dass der größte Mangel an Geldern … für Strom besteht.

5/5 - (144 votes)
Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein