In der KI-Branche hat OpenAI diese Woche GPT-4o eingeführt und damit den Weg dafür geebnet, dass multimodale Modelle in die täglichen Anwendungen der Menschen eindringen.
Das neue Modell GPT-4o kann jede Eingabekombination aus Text, Bildern und Audio akzeptieren und sofort jede Ausgabekombination aus Text, Audio und Bild generieren, wodurch das chatgpt-Erlebnis erheblich verbessert wird. Insbesondere ähnelt die Interaktion mit ChatGPT eher einer Gespräch mit einer realen Person, mit menschlichen Emotionen und seinem Ton ist manchmal geduldig und gelegentlich verspielt und präsentiert eine natürlichere Mensch-Computer-Interaktion.
Aufgrund der zahlreichen von OpenAI angekündigten Anwendungsfälle sowie vorläufiger Tests durch Entwickler oder normale Internetnutzer ist die Leistung von ChatGPT, das GPT-4o unterstützt, erstaunlich:
1. Durch die Mobiltelefonlinse und ChatGPT scheint es, dass auch sehbehinderte Freunde die Welt sehen können.
2. Zwei ChatGPTs sprechen miteinander und teilen die Menschen und Dinge, die sie durch die Linse des Mobiltelefons sehen.
3. Sal Khan, der Gründer der Online-Bildungsplattform Khan Academy, und sein Sohn Imran Khan nahmen am Test ChatGPT teil, lasen die auf dem Bildschirm angezeigten Mathematikfragen und brachten Imran Khan Schritt für Schritt bei, den Sinus sin(α) zu lösen.
4. Mit der Mac-Version der ChatGPT-App kann ChatGPT auch an Videokonferenzen teilnehmen, Ideen vorbringen, diese gemeinsam diskutieren und schließlich die wichtigsten Punkte zusammenfassen.
5. Bereiten Sie sich vor dem Vorstellungsgespräch mit ChatGPT vor, das einige Vorschläge machen kann.
6. ChatGPT wurde Dolmetscher auf der Konferenz und übersetzte fließend Italienisch und Englisch.
7. Durch die Mac-Version der ChatGPT-App und reine Breakout-Spiel-Screenshots kann ChatGPT Spielcode generieren.
Die neue ChatGPT-Mac-App ist unglaublich.
Ich habe einen voll funktionsfähigen Breakout-Spielcode erhalten, indem ich eine Verknüpfung zum Aufrufen der App mit GPT-4o und einen einfachen Screenshot meines Bildschirms verwendet habe.
So viele Anwendungsfälle und schnellere Arbeitsabläufe. pic.twitter.com/hBU2arjvMv
— Alvaro Cintas (@dr_cintas) 14. Mai 2024
8. Verwenden Sie CahtGPT auf Ihrem Mobiltelefon, um in 20 Sekunden eine STL-Datei eines 3D-Modells zu erstellen.
Ich habe GPT-4o verwendet, um in ca. 20 Sekunden eine STL-Datei für ein 3D-Modell auf meinem Telefon zu erstellen.
Ziemlich bemerkenswert, was Sie jetzt mit KI und einfacher Eingabeaufforderung generieren können. pic.twitter.com/2fbObrpPol
— Min Choi (@minchoi) 14. Mai 2024
9. Durch die Linse des Mobiltelefons und ChatGPT wird der geschriebene Text auf dem Papier erkannt. Obwohl es einige Fehler bei der Zeichenerkennung gibt, ist das Erlebnis immer noch ausgezeichnet.
GPT-4o ist in der 18. Handschrift wirklich bemerkenswert. Ich gab ihm den folgenden Brief und bat ihn um eine Abschrift. Ein paar sehr kleine Fehler … erstaunlich! pic.twitter.com/3JevZvd5p5
– Generative Geschichte (@HistoryGPT) 14. Mai 2024
10. ChatGPT, das GPT-4o unterstützt, verfügt über eine detailliertere Fähigkeit zur Interpretation von Ausdrücken und erreicht so die menschliche Ebene.
Die Fähigkeit von GPT-4o, Gesichter zu interpretieren, liegt auf menschlicher Ebene. pic.twitter.com/kYdFrrTp5m
— Blumen aus der Zukunft (@futuristflower) 15. Mai 2024
(Quelle des ersten Bildes:FilmBildschirmfoto)
Weiterführende Literatur:
- ChatGPT verwandelt sich in einen leistungsstarken Sprachassistenten. Das neue Modell GPT-4o von OpenAI hebt die Konversationsfunktionen hervor