Wenn Sie chatgpt fragen: „Wer ist der CEO von X?“ Sie könnten davon ausgehen, dass Sie mit diesem auf künstlicher Intelligenz basierenden Tool die richtige Antwort erhalten. Schließlich kann eine einfache google-Suche diese Informationen leicht aufdecken. Aber wenn Sie den Chatbot verwenden, wird er Ihnen nicht sagen, dass der X-CEO Linda Yaccarino ist, oder auch nur Elon Musk erwähnen. ChatGPT wird auch nicht wissen, dass X das Unternehmen ist, das früher als Twitter bekannt war – und die Gründe dafür sind für jeden, der Tools wie ChatGPT verwendet, äußerst wichtig zu verstehen.
Als OpenAI aus San Francisco Ende letzten Jahres die erste Version des Chatbots der Öffentlichkeit zugänglich machte, eroberte es die Welt im Sturm. Zwei Monate nach dem Start von ChatGPT im November 2022 hatte es Berichten zufolge eine Nutzerbasis von über 100 Millionen Benutzerund übertraf damit den Aufstieg von TikTok.
Aber künstliche Intelligenz ist noch lange nicht wirklich intelligent. Ein genauer Blick darauf, wie sich die KI in den letzten Jahren entwickelt hat – und was sie über die San Francisco Bay Area in jedem ihrer Stadien weiß – zeigt, wie schnell sie sich entwickelt hat und wie viel weiter sie noch gehen muss.
Das Auffälligste an der Technologie ist die bemerkenswerte Fortschrittsgeschwindigkeit. GPT-3.5-Turbo – das Modell, das die meisten Erlebnisse auf ChatGPT ermöglicht – landete in den unteren 10 Prozent der Prüfungsteilnehmer für Anwaltsprüfungen. laut OpenAI. GPT-4, das neueste Modell von OpenAI, das etwa drei Monate später veröffentlicht wurde, landete in den Top 10 Prozent. In den letzten Monaten hat ChatGPT geholfen Erstellen Sie maßgeschneiderte Speisepläne Bei diätetischen Einschränkungen helfen Sie Liebhabern mit sternenklaren Augen Eheversprechen basteln und sogar werden ein unerwarteter Verbündeter zur Bekämpfung überteuerter Internetrechnungen.
Es herrscht jede Menge Aufregung rund um diese Tools. Aber es ist wichtig zu betonen, dass es sich nicht um allwissende Orakel handelt. ChatGPT und ähnliche KI-Chatbots wie Bard von Google und Claude von Anthropic weisen alle entscheidende Einschränkungen auf, wenn es um aktuelle Ereignisse, Erfindungen, Argumente und Voreingenommenheit geht. Diese Einschränkungen kann dich stolpern lassen wenn Sie mit ihnen nicht vertraut sind.
Hier finden Sie einen Überblick darüber, wie die Technologie funktioniert, wie sie sich entwickelt hat und was passierte, als wir ihr mehrere Fragen zur Bay Area stellten.
Um Chatbots wie ChatGPT zu verstehen, müssen Sie die Technologie kennen, die ihnen zugrunde liegt – Large Language Models (LLMs).
Wenn Sie LLM-basierte Tools verwenden, ist es hilfreich, sie als zu betrachten computergesteuerter Papagei. So wie Papageien die menschliche Sprache nachahmen, ohne zu verstehen, was aus ihrem Mund kommt, wiederholen LLM-gestützte Chatbots Muster aus Hunderten Milliarden Wörtern, die sie im Internet und in Büchern „gehört“ haben.
Wenn Sie ChatGPT mit einer Frage auffordern, versucht es immer wieder zu erraten, welches Wort wahrscheinlich als nächstes kommt, wie eine leistungsstarke Version der automatischen Vervollständigung auf der Tastatur Ihres Telefons.
Das bemerkenswerteste Wahrzeichen in San Francisco ist der …
Golden | 82,54 % |
---|---|
ikonisch | 16,1 % |
berühmt | 0,53 % |
Welt | 0,23 % |
Wahrscheinlichkeitsprozentsatz des nächsten Wortes in diesem Satz gemäß GPT-3.
Zwischen 2019 und 2023, in nur vier Jahren, hat sich die Technologie rasant weiterentwickelt. Das ChatGPT-Modell wurde gesprächiger. Das neueste Modell, GPT-4, bietet scheinbar anspruchsvolle (und manchmal umstritten) Antworten, die in den letzten Monaten die Schlagzeilen beherrschten.
GPT-2
Kann grundlegende Aufgaben wie die Beantwortung von Fragen, Übersetzungen und Zusammenfassungen ausführen.
GPT-3
Schulung mit mehr Texten aus dem Internet und Büchern. Befolgen Sie Anweisungen besser und beantworten Sie Fragen wahrheitsgemäßer.
GPT-3.5-Turbo
Unterstützt die meisten ChatGPT-Interaktionen. Konversationeller, nutzt menschliches Feedback, um genauer zu sein.
GPT-4
Verfügbar für ChatGPT Plus-Abonnenten. Verbesserte Fähigkeit, menschliche Absichten zu verfolgen, sachlich genauer.
Chatbots, die von heutigen LLMs angetrieben werden, sind nicht die superintelligenten Wesen, die Sie vielleicht aus Hollywood-Filmen kennen. Wie die obige Aufforderung zeigt, tragen sie den Schatten von Vorurteilen in sich, die in die Daten eingepflanzt sind, auf deren Grundlage sie trainiert wurden. Diese Tools erfinden gelegentlich auch Dinge, können sich nicht auf aktuelle Ereignisse beziehen und scheitern oft bei einfachen Denkaufgaben, die ein 8-Jähriger lösen könnte.
Um Tools wie ChatGPT verantwortungsvoll nutzen zu können, ist es wichtig, sich der Einschränkungen bewusst zu sein. Jede nachfolgende Generation von LLMs hat einen Schritt in Richtung Minimierung dieser Einschränkungen gemacht, aber sie bestehen immer noch.
Aktuelle Ereignisse
Die offensichtlichste Einschränkung von LLMs ist ihr mangelndes Bewusstsein für aktuelle Ereignisse. Das liegt daran, dass die Trainingsdaten – diese Hunderte Milliarden Wörter, die diese computerisierten Papageien „gehört“ haben – vor Jahren abgeschnitten wurden. Unternehmen wie OpenAI, Google und Microsoft haben kürzlich damit begonnen, ihren LLMs Internetzugang zu gewähren, aber trotz der Fülle an Informationen, die im Internet verfügbar sind, Sie sind immer noch unvollkommen.
ChatGPT bezieht Informationen aus Trainingsdaten, die etwa im September 2021 enden. Wenn Sie eine Frage zu etwas stellen, das nach 2021 passiert ist, wird selbst der fortgeschrittenste LLM die Antwort nicht kennen.
Herstellung
Zusätzlich zu einem begrenzten Wissen über aktuelle Ereignisse erfinden ChatGPT und ähnliche Tools manchmal einfach nur Dinge. LLMs können sicher Informationen generieren, die nicht auf realen Fakten basieren, oft wenn sie zu einem Thema aufgefordert werden, das in den Trainingsdaten nicht abgedeckt wird.
Argumentation
LLMs stehen auch vor Herausforderungen, wenn es um grundlegendes Denken geht. Stellen Sie sich eine Frage wie „Was ist das längste 5-Buchstaben-Wort in der englischen Sprache?“ vor. Es ist eine einfache Frage für Menschen, die verstehen, dass alle Wörter mit fünf Buchstaben die gleiche Länge haben. Allerdings können LLMs über diese scheinbar einfachen Aufforderungen stolpern.
Voreingenommenheit
Schließlich kommt noch das Problem der Voreingenommenheit in LLMs. Wenn sie aus riesigen Datensätzen lernen, die mit menschlicher Sprache gefüllt sind, erkennen sie unweigerlich die in diesen Daten vorhandenen Vorurteile. Ganz gleich, ob es sich um Geschlechterstereotypen, Rassismus, kulturelle Annahmen oder andere Formen der Voreingenommenheit handelt, diese Modelle können unbeabsichtigt Vorurteile widerspiegeln.
Da sich die Technologie, die ChatGPT und anderen generativen KI-Tools zugrunde liegt, weiterentwickelt, ist es wichtig, sich der Einschränkungen bewusst zu sein und sie zu verstehen. Sie haben die Fähigkeit, uns zu inspirieren, zu unterstützen und zu amüsieren, aber sie verstehen uns genauso wenig wie ein Papagei die Frage versteht: „Polly will einen Cracker?“
Dies sind mächtige, unvollkommene Werkzeuge.
Methodik
Wir haben die großen Sprachmodelle von OpenAI verglichen: GPT-2, GPT-3, GPT-3.5-Turbo und GPT-4. Jedes Modell wurde mit der gleichen Aufforderung zum Erstellen von Vergleichstabellen getestet. GPT-3, GPT-3.5-Turbo und GPT-4 wurden mit dem Playground-Tool von OpenAI getestet, während GPT-2 mit dem auf unserem Computer ausgeführt wurde gpt2-xl Modell.
Aus Gründen der Konsistenz wurden alle Modelle unter identischen Einstellungen verwendet. Wir legen eine maximale Token-Länge von 256 fest (Token sind entweder Wortfragmente oder ganze Wörter) und eine Temperatur von 0, um die Ausgabezufälligkeit zu verringern. Einige Textgenerationen wurden aus Gründen der Länge bearbeitet.
Credits
Berichterstattung von Ryan Serpico. Design und Illustrationen von Lesley Huang. Design und Entwicklung von David Deloso. Bearbeitet von Brittany Schell Und Evan Wagstaff.