Calvin Wankhede / Android Authority
Wir wissen schon seit einiger Zeit, dass OpenAI aktiv an der Entwicklung seines GPT-5-Sprachmodells der nächsten Generation arbeitet. Aber Anfang dieser Woche überraschte uns das Unternehmen mit einem inkrementellen Update für GPT-4 Turbo. Das neue Modell mit dem Namen GPT-4o ist ein umfangreiches Update, das Sprachinteraktion in Echtzeit, Videofunktionen sowie schnellere und genauere Antworten bietet. Aber abgesehen von auffälligen Demos ist GPT-4o auch das erste größte Update für kostenlose chatgpt-Benutzer seit weit über einem Jahr. Hier erfahren Sie, warum es so eine große Sache ist.
Was ist ChatGPT-4o?
Edgar Cervantes / Android Authority
ChatGPT-4o oder GPT-4o ist das neueste und fortschrittlichste Sprachmodell von OpenAI, das in Echtzeit über Audio, Video und Text nachdenken kann. Das Modell kann innerhalb von durchschnittlich nur 320 Millisekunden auf Audioeingaben reagieren, was etwa so schnell ist wie die Reaktionszeit eines Menschen, wodurch es in der Lage ist, natürliche Gespräche zu führen.
Letztes Jahr habe ich über die Sprachkonversationsfunktion von ChatGPT geschrieben und wie sie bereits eine reale Konversation nahezu perfekt nachgeahmt hat. GPT-4o steigert dieses Erlebnis noch weiter. Während die vorherige Funktion unterschiedliche Modelle für die Spracherkennung und Antwortgenerierung verwendete, wurde GPT-4o darauf trainiert, den gesamten Prozess von Anfang bis Ende abzuwickeln. Ausgestattet mit den Fähigkeiten eines großen Sprachmodells wie GPT-4 kann die KI laut OpenAI sogar Emotionen in Stimmen erkennen.
GPT-4o ist schneller, genauer und kann sogar Emotionen in Ihrer Stimme erkennen.
Die verbesserte Sprachfähigkeit von GPT-4o wäre an sich schon eine große Sache, aber das ist nicht die einzige neue Funktion, die OpenAI vorstellte. Das neue Sprachmodell bietet dank eines neuen Tokenizers auch deutlich schnellere Antworten. In nicht-englischen Sprachen und insbesondere solchen, die nicht das lateinische Alphabet verwenden, wird sich das neue Modell laut OpenAI doppelt so schnell anfühlen wie das vorherige GPT-4 Turbo-Modell.
Die bombastische Ankündigung der Veranstaltung war, dass GPT-4o allen ChatGPT-Benutzern zur Verfügung steht. Das ist richtig – Sie können kostenlos auf die neueste und leistungsfähigste Version des Chatbots zugreifen, es ist kein ChatGPT Plus-Abonnement erforderlich. Dies ist das erste Genauigkeits- und Geschwindigkeitsupdate für kostenlose Benutzer seit der Veröffentlichung des Chatbots Ende 2022.
Die guten Nachrichten für kostenlose Benutzer enden hier jedoch nicht. Da GPT-4o eine Erweiterung des GPT-4-Sprachmodells von OpenAI ist, ist es auch in der Lage, das Internet zu durchsuchen und seine Antworten auf Fakten zu überprüfen. Bisher waren kostenlose Nutzer auf das GPT-3.5-Modell angewiesen, das deutlich weniger intelligent war und eine Datenunterbrechung von Januar 2022 hatte.
GPT-4o in Aktion: So verwenden Sie es
Wenn Sie sich längere Zeit nicht bei ChatGPT angemeldet haben, ist es jetzt an der Zeit, dies zu ändern. OpenAI gibt an, dass es den Zugang zu GPT-4o mit sofortiger Wirkung allen Benutzern in Wellen öffnet. Ich verwende Microsoft Copilot seit etwa einem Jahr, da es kostenlosen Zugriff auf GPT-4 bietet, und habe ChatGPT in dieser Zeit daher kaum genutzt. Dennoch wurde ich sofort nach der Anmeldung mit dem Zugang zu GPT-4o in „begrenzter Kapazität“ begrüßt.
Es ist erwähnenswert, dass die Sprachkonversationsfunktion von GPT-4o noch nicht verfügbar ist. Sam Altman, CEO von OpenAI, sagte, dass die Einführung in den kommenden Wochen beginnen werde. Sprachgespräche werden zumindest auf absehbare Zeit auch ausschließlich ChatGPT Plus-Benutzern zur Verfügung stehen.
Ohne diesen Haftungsausschluss ist GPT-4o immer noch ein beeindruckendes Update für sich – insbesondere für nicht zahlende Benutzer. Geben Sie eine Eingabeaufforderung ein und Sie werden feststellen, dass das Modell im Vergleich zu GPT-4 beeindruckend schnell reagiert. Allerdings ist es möglicherweise nicht unbedingt so schnell wie das Vorgängermodell GPT-3.5, das seit seiner Erstveröffentlichung vor vier Jahren kontinuierlich verfeinert und optimiert wurde.
GPT-4o testen: Ist es wirklich genauer?
Abgesehen von der Geschwindigkeit besteht das große Highlight von GPT-4o darin, dass es deutlich genauere Antworten liefert. Und im Gegensatz zu GPT-3.5 gibt es auch keinen festen Stichtag. Das bedeutet, dass Sie dem Chatbot endlich sachliche Fragen stellen können, ohne befürchten zu müssen, dass er halluziniert oder falsche Antworten ausspuckt. Wie groß ist das Upgrade von GPT-4o? In meinen Tests ein ziemlich großes Problem. Hier ist ein direkter Vergleich, bei dem ich sowohl GPT-3.5 als auch GPT-4o eine einfache sachliche Frage stelle:
Wie Sie an diesem relativ einfachen Beispiel sehen können, liefern beide Sprachmodelle die richtige Antwort. GPT-4o reagierte jedoch deutlich sicherer und lieferte eine ausführlichere Antwort. Das ältere GPT-3.5-Modell (das bisher das einzige Modell war, das kostenlosen ChatGPT-Benutzern zur Verfügung stand) reagierte stattdessen aus dem Gedächtnis, was erklärt, warum es uns aufforderte, die Informationen mit einer offiziellen Quelle zu überprüfen.
Interessanterweise konnte ich für diese spezielle Frage nicht von GPT-4o zu GPT-3.5 wechseln, da die Option mit der Meldung „Dieses Modell unterstützt die Verwendung von Tools nicht“ ausgegraut war. Wenn Sie ChatGPT also eine sachliche Frage stellen, durchsucht es nun automatisch das Internet und verwendet das neueste Modell. Hier ist ein weiteres Beispiel, bei dem ich ChatGPT gefragt habe, welcher Chip das Galaxy S24 Ultra enthält, mit der Bedingung, dass ich es in Großbritannien kaufe.
Dank der Fähigkeit von GPT-4o, das Internet zu durchsuchen, hieß es korrekt, dass das S24 Ultra weltweit mit dem Snapdragon 8 Gen 3 ausgeliefert wird. Es wurde sogar klargestellt, dass die regulären und Plus-S24-Varianten in Europa mit dem Exynos 2400 geliefert werden. Ich habe in der Vergangenheit anderen Chatbots dieselbe Frage gestellt, nur um eine selbstbewusst klingende, aber ungenaue Antwort zu erhalten. Schauen Sie sich einfach die Antwort von GPT-3.5 oben an.
Obwohl wir noch ein paar Wochen davon entfernt sind, das volle Potenzial von GPT-4o, insbesondere seine Sprachfunktionen, auszuschöpfen, ist das Basiserlebnis an sich immer noch beeindruckend. Besser noch: Es ist allgemein und für jedermann kostenlos zugänglich. Wenn Sie also bisher Microsoft Copilot oder google Gemini anstelle von ChatGPT verwendet haben, ist es jetzt möglicherweise an der Zeit, umzusteigen.