OpenAI hat ein Update seines fortschrittlichen GPT-4-Turbo-Modells für künstliche Intelligenz veröffentlicht, das „wesentlich verbesserte“ Antwort- und Analysefunktionen mit sich bringt.
Zunächst steht das Modell, das KI-Vision-Technologie zum Analysieren und Verstehen von Inhalten aus Video, Bild und Audio umfasst, nur Entwicklern zur Verfügung, aber OpenAI sagte, dass diese Funktionen bald bei chatgpt verfügbar sein werden.
Dies ist das erste Mal, dass GPT-4-Turbo mit Vision-Technologie Drittentwicklern zur Verfügung gestellt wird. Dies könnte zu einigen überzeugenden neuen Apps und Diensten rund um Mode, Programmierung und sogar Spiele führen.
Das neue Modell verschiebt außerdem den Wissensstichtag auf Dezember 2023. Dies ist der Zeitpunkt, an dem die Schulung der KI abgeschlossen wurde. Zuvor war der Datenschluss April letzten Jahres.
Was ist GPT-4-Turbo?
GPT-4 Turbo mit Vision ist jetzt allgemein in der API verfügbar. Vision-Anfragen können jetzt auch den JSON-Modus und Funktionsaufrufe verwenden. https://t.co/cbvJjij3uL Nachfolgend finden Sie einige großartige Möglichkeiten, wie Entwickler mit Vision bauen können. Schreiben Sie uns eine Antwort 🧵9. April 2024
Der Schwerpunkt von GPT-4-Turbo liegt vor allem auf der Verbesserung der Lebensdauer von Entwicklern, die über einen API-Aufruf auf das OpenAI-Modell zugreifen. Das Unternehmen sagt, dass das neue Update Arbeitsabläufe rationalisieren und effizientere Apps erstellen wird. Dies liegt daran, dass für Bild und Text unterschiedliche Modelle benötigt wurden.
In Zukunft werden das Modell und seine Vision-Analysefunktionen erweitert und zu Verbraucher-Apps wie ChatGPT hinzugefügt, um das Verständnis von Bildern und Videos effizienter zu gestalten.
Dies ist etwas, mit dem google mit Gemini Pro 1.5 begonnen hat, es einzuführen, obwohl der Suchriese es wie OpenAI vorerst auf Plattformen beschränkt hat, die von Entwicklern und nicht von Verbrauchern genutzt werden.
Eine der bekanntesten Anwendungen ist der virale Codierungsagent Devin von Cognition Labs, der in der Lage ist, komplexe Anwendungen aus einer Eingabeaufforderung heraus zu erstellen.
Was können Sie mit GPT-4-Turbo machen?
GPT-4 hat in Benchmark-Tests gegen neue Modelle, darunter Claude 3 Opus oder Googles Gemini, in letzter Zeit nicht besonders gut abgeschnitten. Einige kleinere Modelle übertreffen ihn auch bei bestimmten Aufgaben.
Die Updates sollten das ändern oder zumindest neue überzeugende Funktionen für Unternehmenskunden hinzufügen, bis GPT-5 herauskommt.
Das Update wird mit dem 128.000-Token-Kontextfenster fortgesetzt, was etwa einem 300-seitigen Buch entspricht. Nicht das Größte auf dem Markt, aber für die meisten Anwendungsfälle ausreichend.
Bisher hat sich OpenAI in ChatGPT neben Text und Bildern auch auf die Analyse und das Verstehen von Audiodaten konzentriert. Das neue Update bringt Videos zu mehr Menschen. Wenn es um ChatGPT geht, können Benutzer möglicherweise kurze Videoclips hochladen und die KI eine Zusammenfassung des Inhalts geben oder Schlüsselmomente auswählen lassen.
Mehr von Tom's Guide