OpenAI stellte GPT-4 Omni (GPT-4o) vor während seiner Frühlings-Update am Montag in San Francisco. Chief Technology Officer Mira Murati und OpenAI-Mitarbeiter stellten ihr neuestes Flaggschiffmodell vor, mit dem verbale Gespräche in Echtzeit möglich sind ein freundlicher KI-Chatbot, der überzeugend wie ein Mensch spricht.

„GPT-4o bietet Informationen auf GPT-4-Niveau, ist aber viel schneller“, sagte Murati auf der Bühne. „Wir glauben, dass GPT-4o dieses Paradigma wirklich in die Zukunft der Zusammenarbeit verschiebt, wo diese Interaktion viel natürlicher und viel einfacher wird.“

GPT-40 reagiert sofort auf verbale Aufforderungen mit einer freundlichen Stimme, die unheimlich nach Scarlett Johansson klingt, die im Spielfilm die Stimme des KI-Assistenten verkörperte Ihr. Basierend auf den Demos lässt diese Technologie diesen Film im Wesentlichen Wirklichkeit werden. Die Rede von GPT-4o hat eine emotionale Intonation, manchmal zeigt sie Aufregung, manchmal lacht sie. Darüber hinaus kann es auch Emotionen und Tonalität in der Sprache der Benutzer erkennen. Die OpenAI-Mitarbeiter präsentierten Gespräche mit den KI-Chatbots nahezu ohne Verzögerung, und der Chatbot konnte bei Unterbrechungen sogar schnell wechseln.

Zwei GPT-4os interagieren und singen

Während die Audiofähigkeiten von GPT-4o beeindruckend sind, funktioniert Omni in mehreren Medien. Während chatgpt zuvor Text, Bild und Audio über ein Netzwerk von KI-Modellen verarbeitete, ist GPT-4o ein einziges Modell, das alle drei verarbeiten kann. Dadurch funktioniert alles viel schneller. Sie können GPT-4o mit der Kamera Ihres Telefons ein Bild einer mathematischen Aufgabe zeigen, während Sie verbal mit dem Modell sprechen. Laut OpenAI arbeitet sein neues Flaggschiffmodell mit GPT-4-Intelligenzniveau und setzt gleichzeitig bahnbrechende Maßstäbe bei Mehrsprachigkeit, Audio- und Bildfunktionen.

Siehe auch  Mercedes-Benz fügt ChatGPT zu Ihrem Autoassistenten hinzu, um während der Fahrt mit Ihnen zu sprechen

Mehr lesen: Das neue ChatGPT von OpenAI kann Gute-Nacht-Geschichten erzählen und mathematische Probleme lösen

Nach dieser atemberaubenden Demo veröffentlicht OpenAI GPT-4o als Desktop-Anwendung für macOS. Bezahlte Benutzer erhalten heute auch die macOS-App, GPT-4o wird jedoch in Zukunft auch für kostenlose Benutzer verfügbar sein. Mit der Desktop-Anwendung können Sie Sprachgespräche mit ChatGPT direkt von Ihrem Computer aus starten und Ihren Bildschirm mit minimaler Reibung teilen. Auch die ChatGPT-Website erhält eine vereinfachte Aktualisierung.

Die OpenAI-Mitarbeiter Mark Chen und Barret Zoph demonstrierten am Montag auf der Bühne, wie das multimodale Echtzeit-KI-Modell funktioniert. Die Konversation in Echtzeit funktionierte größtenteils hervorragend, da Chen und Zoph das Modell unterbrachen, um es um Pivot-Antworten zu bitten. GPT-4o erzählte Gutenachtgeschichten, half bei Matheaufgaben und mehr. Zeitweise hatte GPT-4 Omni Schwierigkeiten, die Absichten der Benutzer zu verstehen, aber das Modell meisterte die Ausrutscher recht geschickt.

Matheaufgaben mit GPT-4o

Das Stimmmodell war in der Lage, verschiedene Stimmen zu erzeugen, wenn es eine Geschichte erzählte, lachte und an einer Stelle sogar „Das ist so süß von dir“ sagte. Es ist klar, dass das OpenAI-Team dafür gesorgt hat, dass GPT-4o mehr Emotionen erzeugt und gesprächiger ist als frühere Sprachmodelle. In Demos klang ChatGPT menschlicher als je zuvor.

Ein OpenAI-Mitarbeiter bestätigte dies in einem Tweet Das Unternehmen hat GPT-4o im Chatbot-Bereich von LMSYS Org getestet als „Ich-auch-ein-guter-gpt2-Chatbot.“ Wie viele vermuteten und Sam Altman neckte, waren dies OpenAI-Modelle in Arbeit. Dem Mitarbeiter zufolge übertraf der neueste Chatbot die Konkurrenz, darunter die Branchenführer GPT-4 Turbo und Claude 3 Opus, bei mehreren Kennzahlen deutlich.

Die Veröffentlichung von GPT-4o scheint ein entscheidender Moment für die Zukunft von KI-Chatbots zu sein. Diese Technologie überwindet einen Großteil der unangenehmen Latenzen, die die frühen Chatbots plagten. Man kann sich leicht eine Version von Siri vorstellen, die mit GPT-4o sehr nützlich ist. Diese Echtzeitfähigkeiten sind wahrscheinlich den neuesten Inferenzchips von Nvidia zu verdanken, die Murati vor dem Ende der Präsentation unbedingt erwähnte. Ungeachtet dessen bekräftigte OpenAI mit der Demo am Montag seine führende Position als Marktführer im Bereich KI-Innovation. Jetzt warten wir ab, ob uns die Präsentation genau zeigt, was dieses Ding kann, oder ob es sorgfältig inszeniert wurde, um offensichtliche Mängel zu vermeiden.

Siehe auch  Elliptic bringt ChatGPT in Kryptowährungen ein, um eine tiefergehende und schnellere Risikoerkennung zu ermöglichen

Eine Version dieses Artikels erschien ursprünglich auf Gizmodo.

Zeigen und lernen Sie Spanisch mit GPT-4o

Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein