OpenAI demonstrierte einen neuen Sprachassistenten das Mimik lesen und Gespräche führen – und nach einer Unterbrechung sogar wieder fortsetzen kann.

OpenAI begrüßte die Ankündigung als „die Zukunft der Interaktion zwischen uns und Maschinen“ und sei Teil eines „Wettrüstens“ zwischen führenden Technologieunternehmen, um schnellere und leistungsfähigere KI-Modelle vorzustellen.

In einer Demonstration, die während einer Livestream-Veranstaltung am Montagabend gezeigt wurde, wurde das Model aufgefordert, anhand der Dinge, die über eine Telefonkamera „gezeigt“ wurden, im Raum zu erraten, was jemand tat.

„Es sieht aus wie ein Produktionsaufbau, als würde man ein Video aufnehmen“, sagte das Model.

Es war sogar in der Lage, Emotionen in der Stimme einer Person zu erkennen und entsprechend zu reagieren, wobei die Zuschauer es mit der KI-Assistentin verglichen, die Scarlett Johansson im Film „Her“ spielte.

Sam Altman, CEO von OpenAI, der gesagt hat, dass „Her“ sein Lieblingsfilm ist, sagte nach der Demo auf X (ehemals Twitter) einfach „Her“. „

„Es fühlt sich an wie KI aus Filmen … Mit einem Computer zu sprechen hat sich für mich nie wirklich natürlich angefühlt; jetzt ist es so“, schrieb er später in einem Blogbeitrag.

Das Modell heißt GPT-4o und seine neuen Funktionen ermöglichen es Benutzern, mit chatgpt zu sprechen und ohne Verzögerung Antworten in Echtzeit zu erhalten sowie ChatGPT während des Sprechens zu unterbrechen – beides Kennzeichen realistischer Gespräche, die KI-Sprachassistenten als Herausforderung empfanden .

OpenAI sieht sich wachsender Konkurrenz und dem Druck ausgesetzt, die Nutzerbasis von ChatGPT zu erweitern, seinem beliebten Chatbot-Produkt, das die Welt mit seiner Fähigkeit, menschenähnliche geschriebene Inhalte und Softwarecode zu produzieren, begeisterte.

Siehe auch  Ein Starter-Kit für ChatGPT
Sam Altman, Der Ceo Von Openai, Wird Voraussichtlich Am 13. Mai Chatgpt-Updates Vorstellen (Getty Images)

Sam Altman, der CEO von OpenAI, stellte am 13. Mai die neuesten ChatGPT-Updates vor (Getty Images)

In einer Demo nutzte ChatGPT seine Seh- und Sprachfähigkeiten, um einen Forscher durch das Lösen einer mathematischen Gleichung auf einem Blatt Papier anzuleiten – in einer anderen Demo übersetzte es Sprachen in Echtzeit.

In einem anderen Fall sagte der OpenAI-Forscher dem Chatbot, er sei in bester Stimmung, weil er zeige, „wie nützlich und großartig Sie sind“.

ChatGPT antwortete: „Oh, hör auf! Du bringst mich zum Erröten!“

Altman fügte in seinem Blog hinzu, dass ChatGPT-4o „die beste Computerschnittstelle ist, die ich je verwendet habe“.

„Es ist für mich immer noch ein bisschen überraschend, dass es echt ist“, sagte er. „Es stellt sich als große Veränderung heraus, Reaktionszeiten und Ausdruckskraft auf menschlicher Ebene zu erreichen.“

Das GPT-4o-Modell werde in den nächsten Wochen in ChatGPT verfügbar sein, teilte das Unternehmen mit.

Mira Murati, Chief Technology Officer von OpenAI, sagte auf der Veranstaltung, dass das neue Modell kostenlos angeboten werde, da es kostengünstiger sei als die Vorgängermodelle des Unternehmens.

Für kostenpflichtige Nutzer von GPT-4o gelten höhere Kapazitätsgrenzen als für die kostenlosen Nutzer des Unternehmens, sagte sie.

Darüber hinaus haben Benutzer des kostenlosen ChatGPT jetzt Zugriff auf eine „Durchsuchen“-Funktion, die es ChatGPT ermöglicht, aktuelle Informationen aus dem Web anzuzeigen.

Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein