Vor nicht allzu langer Zeit hat OpenAI eine neue Iteration von chatgpt vorgestellt, bekannt als ChatGPT-4V oder 4 Vision. Mit dieser Version können Benutzer Bilder, Fotos, Texte oder mathematische Probleme hochladen, diese analysieren und Fragen basierend auf dem hochgeladenen Bild beantworten. Diese bemerkenswert leistungsstarke Funktion steht derzeit nur ChatGPT Plus-Kontoinhabern zur Verfügung. Wenn Sie Abonnent sind, finden Sie hier neun Dinge, die Sie mit ChatGPT-4 Vision tun können.
Sehen Sie sich unbedingt das oben eingebettete Video an, um eine vollständige Demonstration der Verwendung von ChatGPT-4 Vision zur Bewältigung dieser Aufgaben zu erhalten.
Objekte identifizieren und kontextualisieren
Andy Walker / Android Authority
Ich begann mit etwas Einfachem: einem Bild einer Zimmerpflanze, die wie ein Kohl aussah, der in einem Topf wächst. Ich habe ChatGPT mit Vision gebeten, es zu identifizieren. Es stellt sich heraus, dass es sich um einen Zierkohl handelt, der für seine leuchtend bunten Blätter bekannt ist und oft zu Dekorationszwecken verwendet wird.
Konvertieren Sie handschriftliche Notizen in Code
Andy Walker / Android Authority
Eine der beeindruckenden Funktionen von ChatGPT-4 Vision ist die Fähigkeit, handschriftliche Notizen und Diagramme zu lesen. Ich habe es mit einem Flussdiagramm getestet, das eine einfache Schleife beschreibt. Trotz der schlechten Handschrift und Zeichnung gelang es ChatGPT, es genau zu interpretieren und es sogar in Python-Code umzuwandeln.
Wandeln Sie Diagramme in Tabellen um
Andy Walker / Android Authority
Ich habe auch ein Diagramm aus einem aktuellen Video über den Tensor G3-Chipsatz verwendet, das die Multi-Core-Ergebnisse von Geekbench 6 zeigt. Ich habe ChatGPT gebeten, dies in eine Tabelle umzuwandeln, und das ging problemlos. Diese Funktion kann nützlich sein, um grafische Daten in ein besser verwaltbares Format zu konvertieren.
Berechnen Sie visuelle mathematische Probleme
Andy Walker / Android Authority
Als nächstes präsentierte ich ihm ein visuelles Mathe-Puzzle mit Feuerwerk und Sternen. Trotz einiger Farbverwechslungen hat ChatGPT das Feuerwerk, das nicht abgefeuert wurde, korrekt identifiziert.
Beschreiben und analysieren Sie Diagramme
Andy Walker / Android Authority
Anschließend habe ich eine Währungsumrechnungstabelle von US-Dollar in Euro hochgeladen, die einen Zeitraum von einem Jahr abdeckt. ChatGPT hat das Diagramm genau beschrieben und sogar eine Analyse des Wertes des US-Dollars im Vergleich zum Euro bereitgestellt. Es ist jedoch wichtig zu beachten, dass ChatGPT nicht für finanzielle oder medizinische Beratung verwendet werden sollte.
Text in ein Bild transkribieren
Andy Walker / Android Authority
Für diejenigen, die sich für die Erforschung der Familiengeschichte interessieren, kann ChatGPT ein nützliches Werkzeug sein. Ich habe ein Bild eines britischen Volkszählungsdokuments aus dem Jahr 1851 hochgeladen und ChatGPT gebeten, es zu transkribieren. Trotz eines kleinen Fehlers bei der Übertragung eines Nachnamens wurde eine lobenswerte Arbeit geleistet.
Interpretieren Sie komplexe, von KI erstellte Bilder
Andy Walker / Android Authority
Ich habe es auch mit einem KI-generierten Bild einer Meereslandschaft mit zwei Monden getestet. ChatGPT lieferte eine detaillierte Bildbeschreibung, einschließlich der kleinsten Elemente, und demonstrierte damit seine Fähigkeit, komplexe visuelle Darstellungen zu interpretieren und zu beschreiben.
Erstellen Sie Unterrichtspläne für Lehrer
Andy Walker / Android Authority
Schließlich habe ich ihm ein Bild eines unausgeglichenen Binärbaums und eines AVL-Baums gegeben und ihn gebeten, auf der Grundlage des Bildes einen Unterrichtsplan für einen Informatikunterricht an der Oberstufe zu erstellen. Es wurde ein umfassender Unterrichtsplan entwickelt, der sein Potenzial als pädagogisches Instrument unter Beweis stellte.
Lesen Sie „versteckte“ Nachrichten
Andy Walker / Android Authority
In einem unterhaltsamen Abschlusstest habe ich ein scheinbar leeres gelbes Bild mit einer versteckten Nachricht hochgeladen. ChatGPT hat die versteckte Nachricht erfolgreich gelesen, die in einer Farbe geschrieben ist, die mit bloßem Auge kaum wahrnehmbar ist. Dies zeigt die Fähigkeit von ChatGPT-4 Vision, subtile Farbunterschiede zu erkennen.
Zusammenfassend lässt sich sagen, dass ChatGPT-4 Vision ein leistungsstarkes Tool mit vielen Anwendungen ist, von der Bildanalyse bis zur Bildungsplanung. Es ist eine spannende Entwicklung im Bereich der KI und ich bin gespannt, wie sie voranschreitet.