Yuichiro Chino/Getty Images
OpenAI hat vor einer Woche eine neue Funktion für chatgpt namens „Memory“ vorgestellt, die Dinge speichert, auf die Sie dem Programm ausdrücklich Zugriff gewähren, für die spätere Verwendung.
Neben dem Speicher ist zu beachten, dass ChatGPT auch vorhandene Datei-Upload-Funktionen zur Analyse von Text und Bildern nutzen kann. Sie ziehen einfach eine Datei per Drag & Drop in das Chat-Fenster, z. B. eine PDF- oder JPEG-Datei, fügen bei Bedarf eine Eingabeaufforderung hinzu und ChatGPT beginnt mit der Erstellung einer Textausgabe basierend auf dem, was Sie hochgeladen haben.
Außerdem: So verwenden Sie ChatGPT
Die Funktion steht allen zahlenden Benutzern der „Plus“-Version für 20 US-Dollar pro Monat zur Verfügung. Die Plus-Version bietet zusätzlich die Möglichkeit, anstelle von Version 3.5 das neueste ChatGPT, Version 4, zu verwenden, und die Qualität der Ausgabe kann deutlich besser sein. Plus ermöglicht auch die Verwendung von DALL-E, dem Bilderzeugungsprogramm.
Die offensichtlichsten Verwendungszwecke für das Hochladen von Dateien sind Zusammenfassungen, Gliederungen und fortgeschrittenere Arten der semantischen Suche, die über die reine Stichwortsuche hinausgehen. Das Hochladen von Dateien ist einfach: Einfach ziehen.
Die Datei-Upload-Funktion glänzt, wenn ein langes Dokument vorgelegt und beispielsweise bestimmte Arten von Inhalten thematisch isoliert werden sollen. Hierbei handelt es sich um eine Form der semantischen Suche, die nicht ausschließlich auf einem einzelnen Schlüsselwort basiert.
Ich habe beispielsweise einen 4.500 Wörter umfassenden Bericht über spezielle Halbleiter namens Siliziumkarbid hochgeladen. Siliziumkarbid wird in Tesla und anderen Elektrofahrzeugen häufig zur Herstellung des sogenannten Traktionswechselrichters verwendet. Aber es gibt weniger offensichtliche Anwendungen. Ich fragte ChatGPT: „Gibt es in diesem Bericht über Siliziumkarbid Hinweise auf nicht-automobile Anwendungsfälle?“
Außerdem: Die besten KI-Chatbots
ChatGPT antwortete mit einer hervorragenden Zusammenfassung von sechs Anwendungsfällen, die im Bericht identifiziert wurden und sich nicht auf Autos bezogen. Das ist wirkungsvoller als die Verwendung einzelner Schlüsselwörter. Ich habe darüber nachgedacht, ChatGPT als meine erste Anlaufstelle für die Arbeit mit langen Dokumenten zu verwenden.
Eine Textzusammenfassung ist bei langen Interviewprotokollen hilfreich. Ich habe ein Transkript mit 6.800 Wörtern hochgeladen und eine brauchbare Zusammenfassung der wichtigsten Themen erhalten, die als Anfang einer Gliederung für ein Interview auf der Grundlage des Transkripts dienen könnte.
Allerdings sind solche Zusammenfassungen kein Ersatz für die Bearbeitung und Gestaltung einer Geschichte. Diese Art der Datenkomprimierung erfordert die Identifizierung von Themen, deren sinnvolle Umformulierung und vor allem die Entscheidung, welche Dinge weggelassen werden sollen. Diese Dinge, insbesondere was man weglassen sollte, übersteigen derzeit die Möglichkeiten von ChatGPT, obwohl spezifischere Arten der Aufforderung hilfreich sein können.
Die Dateianalyse von ChatGPT kann Bilddateien verarbeiten, jedoch noch keine Videos. Wenn verschiedene Bilder hochgeladen werden, kann das Programm den Inhalt zufriedenstellend identifizieren und sogar eine beschreibende Kopie hinzufügen. Das kann beispielsweise für Untertitel nützlich sein.
Außerdem: Die besten KI-Bildgeneratoren
ChatGPT identifizierte die Skyline von New York City und das Empire State Building und kommentierte die Mischung aus alten und neuen Stilen.
Eine Straßenszene in Midtown Manhattan rief auch eine nützliche beschreibende Bildunterschrift der Maschine hervor.
Ich konnte ein Kunstwerk einreichen, das auf einem gemeinfreien Bild von Alan Turing basierte, den das Programm identifizierte, und das mit Kommentaren zur Absicht des Bildes versehen war.
ChatGPT bot eine angemessene, wenn auch langweilige Beschreibung des ZDNET-Fotos der OpenAI-Führungskräfte Sam Altman und Mira Murati aus einem Artikel über die beiden vom November, ohne die Personen tatsächlich zu identifizieren.
Die Fähigkeit der KI, Bilder und Videos zu analysieren, entwickelt sich rasant weiter. Alphabets google hat kürzlich sein neuestes großes Sprachmodell vorgestellt, Zwillinge 1.5. Das Programm ist in der Lage, in einem 440-seitigen Transkript der Apollo-Mission zum Mond den Moment zu fokussieren, in dem Neil Armstrong „einen kleinen Schritt“ auf der Mondoberfläche macht. Es gelang auch, Zeitstempel in einem Stummfilm von Buster Keaton herauszusuchen. Solche Fähigkeiten übersteigen immer noch die Präzision des Datei-Uploads von ChatGPT.
Außerdem: Was sind Zwillinge? Alles, was Sie über das neue KI-Modell von Google wissen sollten
Es ist klar, dass die Dokumentenanalyse irgendwann mit der Speicherfunktion in ChatGPT verschmelzen wird. Das manuelle Eintippen von Erinnerungen an der Eingabeaufforderung ist nicht unbedingt so effizient wie das Bereitstellen eines vollständigen Dokuments mit allen Dingen, die man auf ChatGPT anwenden möchte, wie z. B. Referenzen und Hintergrundinformationen. In einem Jahr wird die Nutzung von Gedächtnis und Analyse wahrscheinlich einer der Hauptwege sein, mit denen sich ChatGPT seit seiner aktuellen Inkarnation weiterentwickelt hat.