Datenvisualisierung ist eine entscheidende Fähigkeit für jeden, der mit Daten arbeitet. Die Erstellung schöner, informativer Datenvisualisierungen kann jedoch zeitaufwändig sein und spezielle Tools erfordern. Hier kommt ChatGPT ins Spiel. Mit seinen neuesten Updates macht ChatGPT die Datenvisualisierung schneller und einfacher als je zuvor.
Das neueste Update hat das ChatGPT-Erlebnis erheblich verbessert. Anstatt zwischen verschiedenen Optionen wie dem ursprünglichen GPT-4, GPT4 mit erweiterter Analyse oder DALLE-3 wechseln zu müssen, müssen Sie jetzt nur noch eine Eingabeaufforderung eingeben, und ChatGPT interpretiert Ihre Anfrage automatisch und generiert die gewünschten Ergebnisse.
In diesem Blog-Beitrag untersuchen wir, wie Sie mit einfachen englischen Eingabeaufforderungen sofort verschiedene Datenvisualisierungen erstellen können. Dank der erweiterten Datenanalyse von ChatGPT müssen Sie die Daten nicht verarbeiten oder den Python-Code ausführen. Wir gehen einfache Kreis- und Balkendiagramme durch und gehen dann komplexere Visualisierungen mit realen Datensätzen an.
In diesem Teil schreiben wir eine einfache Eingabeaufforderung zum Generieren von Diagrammen. Die Eingabeaufforderung enthält Daten in Form eines Python-Wörterbuchs.
Kuchendiagramm
Bevor wir eine Eingabeaufforderung erstellen, stellen Sie bitte sicher, dass Sie das GPT-4-Modell verwenden, da es das einzige ist, das die Generierung von Visualisierungen unterstützt.
Wir werden eine Eingabeaufforderung schreiben, um eine Kreisdiagramm-Visualisierung basierend auf verschiedenen Nährstoffdaten zu erstellen. Darüber hinaus haben wir ChatGPT gebeten, eine hellere Farbkombination zu verwenden, da die Standardfarben ziemlich hell sind.
Prompt: Generate a pie chart of values {"Vitamin A":5, "Vitamin B": 1, "Vitamin C": 4, "Water": 90} to keep the color combination light.
Wie Sie sehen, haben wir tolle Ergebnisse erzielt.
Wenn Sie den Python-Code hinter der Visualisierung sehen möchten, müssen Sie am Ende des Ergebnisses auf das Terminal-Logo klicken.
Danach erscheint ein Fenster mit dem Quellcode, den Sie selbst ändern und ausführen können. Dieser Schritt ist jedoch nicht zwingend erforderlich, da ChatGPT lediglich den Code ausführt und die Visualisierungen als Bilder anzeigt. Sie können diese Bilder für Ihre Präsentation oder Ihren Bericht speichern.
Bar-Chat
Im nächsten Teil stellen wir CO2-Emissionsdaten für das Auto bereit und überlassen ChatGPT die Arbeit.
Prompt: Generate a bar plot co2 emissions of values {"Car A":30, "Car B": 25, "Car C": 20}.
Es wurden der Titel sowie die x- und y-Beschriftungen hinzugefügt und eine absteigende Reihenfolge sichergestellt. Perfekt!!!
Anstatt die Ausgabe von ChatGPT übermäßig zu kontrollieren, können Sie ChatGPT bitten, unabhängig Ergebnisse zu erstellen, ähnlich wie bei verschiedenen Python-AutoViz-Bibliotheken. Indem Sie einfach den Datensatz bereitstellen und eine vollständige explorative Datenanalyse anfordern, um die erforderlichen Diagramme für Ihre Überprüfung zu erstellen.
In unserem Fall stellen wir es mit einem zur Verfügung Einkaufstrends für Kunden Datensatz, der wertvolle Einblicke in Verbraucherverhalten und Kaufmuster bietet.
Prompt: Perform exploratory data analysis on customer shopping trends dataset and display only plots.
Das ChatGPT lieferte schnelle Ergebnisse und verarbeitete und analysierte Verbrauchertrends in weniger als einer Minute, eine Aufgabe, deren Codierung und Ausführung bei mir normalerweise mindestens 30 Minuten dauert.
Sie können die Ergebnisse verbessern, indem Sie Folgeaufforderungen bezüglich der Art der Visualisierung bereitstellen, an der Sie interessiert sind.
Prompt: Improve the analysis by plotting a correlation chart, bar chart, pie chart, boxplot, and relplot.
Wenn Sie eine komplexe Visualisierung auf mehreren Ebenen sehen möchten, müssen Sie ChatGPT ausdrücklich danach fragen.
Prompt: Use the dataset to plot various complex visualizations.
Bei der Bewertung von Modellen spielt die Datenvisualisierung eine entscheidende Rolle. In diesem Abschnitt verwenden wir die Diabetes-Datensatz von Kaggle und bitten Sie ChatGPT, mehrere Modelle zu trainieren und zu bewerten. Um die Funktionen von ChatGPT optimal zu nutzen, fordern wir die Anzeige einer Verwirrungsmatrix, eines Präzisionsrückrufs und eines Diagramms zum Vergleich verschiedener Modelle auf.
Prompt: Multiple machine learning models should be trained using the target column "Outcome", and the resulting model evaluation visualization should include a confusion matrix, precision-recall, and model comparison chart.
Es ist offensichtlich, dass ChatGPT außergewöhnlich gute Leistungen erbracht hat. Obwohl die Modelle beim Datensatz keine gute Leistung erbrachten, sind wir von den schnellen und genauen Datenvisualisierungsfunktionen beeindruckt. Es kann zur schnellen Analyse von Datensätzen oder zur Beantwortung von Fragen bei Interviews oder Hausaufgaben verwendet werden.
ChatGPT hat die Art und Weise revolutioniert, wie wir auf einfache Weise Datenvisualisierungen erstellen können. Mit seinen erweiterten Datenanalysefunktionen können Sie mithilfe einfacher englischer Eingabeaufforderungen in Sekundenschnelle beeindruckende und informative Datenvisualisierungen erstellen.
In diesem Beitrag haben wir erfahren, wie ChatGPT auf Anfrage sofort verschiedene Diagramme wie Kreisdiagramme, Balkendiagramme, Korrelationsmatrizen und sogar komplexe Visualisierungen wie Replots erstellen kann.
ChatGPT übertraf auch die Erwartungen, als es darum gebeten wurde, ML-Modelle anhand des Diabetes-Datensatzes zu trainieren und Bewertungsmetriken und Vergleichsdiagramme zu erstellen. Der gesamte Modellerstellungs- und Visualisierungsprozess dauerte kaum eine Minute.
Egal, ob Sie ein einfaches Balkendiagramm, eine erweiterte Modellanalyse oder einfach nur eine schnelle Möglichkeit benötigen, Datensätze zu verstehen, ChatGPT liefert außergewöhnliche Ergebnisse mit minimalem Aufwand. Da sich die Fähigkeiten von Tag zu Tag verbessern, ist es eine spannende Zeit, Ihre Datenvisualisierungsfähigkeiten mit diesem KI-Assistenten zu verbessern.
Abid Ali Awan (@1abidaliawan) ist ein zertifizierter Datenwissenschaftler, der gerne Modelle für maschinelles Lernen erstellt. Derzeit konzentriert er sich auf die Erstellung von Inhalten und das Schreiben technischer Blogs zu maschinellem Lernen und Datenwissenschaftstechnologien. Abid verfügt über einen Master-Abschluss in Technologiemanagement und einen Bachelor-Abschluss in Telekommunikationstechnik. Seine Vision ist es, ein KI-Produkt mithilfe eines graphischen neuronalen Netzwerks für Schüler mit psychischen Erkrankungen zu entwickeln.