Neue generative künstliche Intelligenz (KI)-Tools wie chatgpt haben in den letzten Monaten enormes Interesse geweckt, da sie die Art und Weise verändern können, wie Menschen Informationen finden, neue Produkte erstellen, neue Inhalte entwickeln und in Echtzeit auf neue Ereignisse reagieren. Sie haben auch die Aufmerksamkeit politischer Entscheidungsträger auf sich gezogen, weil die Tools bereits Desinformation verbreitet, Betrug angeheizt und bei Hausaufgaben betrogen haben.

Wer kann es vergessen, als Senator Richard Blumenthal aus Connecticut im Mai eine Senatsanhörung zu der neuen Technologie mit einem KI-Deepfake seiner eigenen Stimme eröffnete? Vorbehalte gegenüber generativer KI breiten sich so schnell aus, dass es bereits überparteiliche Forderungen nach einer strengeren Regulierung und einer stärkeren Offenlegung des KI-Einsatzes gibt.

Ich habe kürzlich mit Anjan Kundavaram, Chief Product Officer bei, gesprochen Genau, ein Anbieter von Datenintegritätslösungen, darüber, wie ChatGPT funktioniert, auf welchen Daten es basiert und wie es Entscheidungen trifft. Anjan und ich diskutierten auch die Einschränkungen der aktuellen Versionen des Tools und warum genaue, konsistente und kontextbezogene Daten für den Erfolg in der KI von entscheidender Bedeutung sind. [Note: I interviewed ChatGPT in an interview earlier this year Click here]

Drenik: Wie werden Programme wie ChatGPT trainiert? Wie verarbeiten und analysieren sie die Daten, die sie aufnehmen?

Kundavaram: Das ist eine gute Frage, denn trotz der Begeisterung in der Branche ist ChatGPT für viele immer noch ein Rätsel. Laut einer aktuellen Prosper Insights & Analytics Laut einer Umfrage haben mehr als die Hälfte der Erwachsenen in den USA (57,6 %) noch nie von dem Tool gehört, und weitere 22,4 % kennen ChatGPT, verstehen aber nicht, was es ist.

Hier finden Sie eine kurze Einführung in die Funktionsweise der Technologie. Große Sprachmodelle (LLMs) sind relativ neu in der KI-Szene. Ihr sogenanntes Gehirn ist ein System namens neuronales Netzwerk, ein komplexes Netz miteinander verbundener Knoten, die Informationen verarbeiten und speichern. ChatGPT verwendet einen neuen Typ eines neuronalen Netzwerks, das sogenannte Transformer-Modell.

Das Transformatormodell ist darauf trainiert, Text zu erzeugen, indem es die statistischen Muster und Beziehungen zwischen Wörtern und Phrasen aus Milliarden von gespeicherten Textzeilen lernt. Das Modell sagt das nächste Wort in einem Satz anhand des Kontexts der vorherigen Wörter voraus. Durch wiederholtes Treffen dieser Vorhersagen lernt das Modell, kohärente und kontextbezogene Antworten zu generieren.

Siehe auch  Nvidia stellt KI-Supercomputer vor, um ChatGPT-Nachfolger zu entwickeln

Um seine Erkenntnisse zu verbessern, sammelt ChatGPT eine riesige Menge an Daten aus verschiedenen Quellen, darunter Bücher, Artikel, Websites, Blog-Beiträge, Tweets und andere Texte aus dem Internet. OpenAI, das Unternehmen, das das Modell entwickelt hat, hat die genaue Größe des Datensatzes nicht bekannt gegeben, aber es handelt sich wahrscheinlich um Hunderte Gigabyte. Riesige Mengen sehr unterschiedlicher Daten sind zweifellos hilfreich, um ein KI-Tool dieser Art zu betreiben, aber wir werden gleich darauf eingehen: Es reicht nicht aus, die Datenmenge zur Verfügung zu haben, wenn es ihnen an Integrität mangelt.

Drenik: Was werden Ihrer Meinung nach einige der größten geschäftlichen Anwendungsfälle für ChatGPT sein?

Kundavaram: Das Potenzial, in verschiedenen Geschäftsaspekten effizient voranzukommen, ist grenzenlos, und ich übertreibe nicht. Es zeichnen sich jedoch einige beliebte Geschäftsanwendungsfälle ab. Der Prosper Insights & Analytics Die bereits erwähnte Umfrage ergab einige interessante Erkenntnisse darüber, wie ChatGPT bereits genutzt wird. Es überrascht nicht, dass Marktforschung am häufigsten eingesetzt wird: 37 % der Befragten gaben an, dass sie das Tool bereits nutzen, um Informationen über die neuesten Branchentrends zu sammeln. Auch die Erstellung von Inhalten belegt einen hohen Stellenwert (22 %), gefolgt von der Nutzung für den Kundensupport (21 %). ChatGPT eignet sich hervorragend für Abteilungen mit Kundenkontakt, da es durch die Automatisierung einfacherer Konversations- und Inhaltserstellungsaufgaben Zeit sparen und die Arbeitsbelastung verringern kann. Dies kann die gesamte Vertriebspipeline beschleunigen, indem die Notwendigkeit, einen Interessenten oder Kunden manuell zu recherchieren, zu identifizieren und mit ihm in Kontakt zu treten, drastisch reduziert wird, sodass den Mitarbeitern mehr Zeit für Geschäftsaufgaben bleibt, die ihre Fähigkeiten und Kenntnisse erfordern.

Drenik: Welche Einschränkungen oder Bereiche gibt es, in denen ChatGPT möglicherweise Schwierigkeiten hat, genaue oder zuverlässige Antworten zu liefern?

Kundavaram: Beginnen wir mit der Tatsache, dass ChatGPT nur auf Daten bis September 2021 trainiert wird und daher nicht über die neuesten Ereignisse oder Entwicklungen informiert ist. Obwohl historische Daten bei der Ableitung dieser Erkenntnisse eine Rolle spielen, werden sie durch einen ständigen Fluss präziser, aktueller Daten wertvoller, die Unternehmen dabei helfen, auf sich ändernde Bedingungen zu reagieren. Das aktuelle Formular von ChatGPT kann keine neuen oder Echtzeitdaten eingeben, was eine Hürde für Unternehmen darstellt, die sich für eine sichere Entscheidungsfindung auf die neuesten Daten verlassen.

Siehe auch  Der Code von Limor Fried ist oft ein De-facto-Standard, und jetzt verwendet ChatGPT ihn #Adafruit #ChatGPT #AI @IEEESpectrum @Ladyada « Adafruit Industries – Macher, Hacker, Künstler, Designer und Ingenieure!

Zusätzlich zu veralteten Informationen ist das Tool auf textbasierte menschliche Gespräche trainiert, und einige dieser Daten können manchmal ungenau, unwahr oder auf andere Weise irreführend sein. Trotz der Bemühungen, Vorurteile während des Trainings zu reduzieren, kann es bei sensiblen Themen oder wenn das Modell auf mehrdeutige Fragen stößt, zu voreingenommenen oder subjektiven Antworten kommen. OpenAI ist sich dieser Einschränkungen bewusst und hat gerade ein neues Beta-Plugin veröffentlicht, mit dem ChatGPT im Internet surfen und Fragen zu neueren Themen und Ereignissen beantworten kann. Derzeit ist es nur für zahlende Abonnenten des Tools verfügbar, aber es wird interessant sein zu sehen, wie sich dies entwickelt.

Drenik: Welchen Einfluss hat die Datenintegrität auf die Schulung und den effektiven Einsatz von KI-Tools?

Kundavaram: Die Integrität der Daten, die einem KI-Modell zugrunde liegen, wirkt sich direkt auf dessen Leistung und Zuverlässigkeit aus. Daher ist es wichtig sicherzustellen, dass die für das Training verwendeten Daten korrekt, konsistent und kontextbezogen sind. Eine Datenintegritätsstrategie hilft Unternehmen dabei, unterschiedliche Datenquellen zu verbinden, stellt ein Höchstmaß an Qualität und Governance sicher und überwacht sie kontinuierlich, damit Probleme proaktiv angegangen werden können, bevor sie nachgelagerte Probleme verursachen. Die KI-Technologie profitiert auch stark von der Kontextvielfalt, die es ihr ermöglicht, aussagekräftigere Muster in den Daten zu entdecken. Standortinformationen und Datenanreicherung sind entscheidende Elemente einer erfolgreichen Datenintegritätsstrategie und tragen dazu bei, zusätzliche Erkenntnisse zu gewinnen, die andernfalls möglicherweise übersehen würden.

Es ist ebenfalls wichtig, Vorurteile während des KI-Trainingsprozesses anzugehen und abzumildern. Techniken wie die sorgfältige Kuratierung von Datensätzen, vielfältige Datendarstellung, vorurteilsbewusste Auswertung und fortlaufende Überwachung können dabei helfen, Vorurteile zu erkennen und zu korrigieren sowie Fairness und Inklusivität zu fördern. Durch die Priorisierung der Datenintegrität können Unternehmen sicherstellen, dass die von KI-Modellen generierten Erkenntnisse vertrauenswürdig und zuverlässig sind.

Siehe auch  ChatGPT kann jetzt auch Bilder generieren ...

Drenik: Welche Auswirkungen hat es, jetzt nicht in bessere Daten zu investieren, da der Einsatz von KI am Arbeitsplatz zunimmt?

Kundavaram: Die Fähigkeiten von ChatGPT und KI/ML im Allgemeinen werden sich in den kommenden Jahren weiter verbessern und scheinbar grenzenlose Möglichkeiten eröffnen, die Vorteile der Technologie zu nutzen. Bei Precisely experimentieren wir bereits mit GPT-Modellen, um Datenqualitäts- und Datenanreicherungsprozesse zu automatisieren, weil wir den Wert dieser Art von Tools erkennen. Bevor jedoch die Verwendung von ChatGPT oder anderen Geschäftsanwendungen von GPT-Modellen in Betracht gezogen wird, ist es wichtig, dass Unternehmen zunächst sicherstellen, dass die zum Trainieren dieser Modelle verwendeten Daten vertrauenswürdig und korrekt für die Verwendung in intelligenten Modellen vorbereitet sind. Wir beginnen bereits, die realen Auswirkungen von KI-Tools zu erkennen, die auf unzuverlässigen oder verzerrten Datensätzen basieren – von beeinträchtigter Gesichtserkennungssoftware, die Frauen und farbige Menschen weniger genau identifiziert, bis hin zu Ungleichheiten in der Gesundheitsversorgung und mehr.

OpenAI erkennt an, dass beim Training von GPT-Modellen die richtigen Daten wichtig sind und Unternehmen darauf achten müssen. Das richtige Training intelligenter Modelle ist nur möglich, wenn Sie über vertrauenswürdige Daten verfügen. Wenn Sie also nicht in hochintegrierte Daten investieren, um diese Technologien voranzutreiben, wird Ihr Unternehmen auf der Strecke bleiben.

Drenik: Vielen Dank für Ihre Erkenntnisse zu diesem Thema, Anjan. Die KI-Innovation schreitet rasant voran und hat enorme Auswirkungen für Regierungen, Unternehmen und Verbraucher gleichermaßen. Der Erfolg hängt letztendlich davon ab, dass KI-Modelle richtig trainiert werden und sichergestellt wird, dass sie mit den richtigen Daten versorgt werden, um genaue, repräsentative und unvoreingenommene Ergebnisse zu erzielen.

Kasse Mein Webseite.

Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein