OpenAI veröffentlichte auf seinem offiziellen Discord-Server einen Artikel, in dem es hieß, dass ursprünglich geplant war, die Alpha-Version des erweiterten Sprachmodus für eine kleine Anzahl von chatgpt Plus-Benutzern Ende Juni zu veröffentlichen, aber aufgrund einiger Probleme, die nicht gelöst wurden, Es musste sein. Der Start wurde auf Juli verschoben.
„Wir verbessern beispielsweise die Fähigkeit des Modells, bestimmte Inhalte zu erkennen und abzulehnen“, schreibt OpenAI. „Wir arbeiten auch hart daran, das Benutzererlebnis zu verbessern und bereiten uns darauf vor, unsere Infrastruktur auf Millionen zu skalieren und gleichzeitig die Reaktionsfähigkeit in Echtzeit aufrechtzuerhalten. Als Teil unserer iterativen Bereitstellungsstrategie werden wir mit Alpha-Tests mit einer kleinen Gruppe von Benutzern beginnen, um Feedback zu sammeln.“ und erweitern Sie das, was wir lernen.
OpenAI sagt, dass der erweiterte Sprachmodus möglicherweise bis zum Herbst nicht für alle ChatGPT Plus-Kunden verfügbar sein wird, abhängig davon, ob er bestimmte interne Sicherheits- und Zuverlässigkeitsprüfungen erfüllt. Diese Verzögerung hat jedoch keine Auswirkungen auf die Einführung neuer Video- und Bildschirmfreigabefunktionen, die auf der Frühjahrspressekonferenz von OpenAI separat vorgestellt wurden.
Zu diesen Funktionen gehören das Lösen mathematischer Probleme anhand von Problembildern und das Erklären der verschiedenen Einstellungsmenüs auf Ihrem Gerät. Diese Funktionen sind nicht nur für ChatGPT auf Smartphones verfügbar, sondern auch für Desktop-Clients wie die MacOS-App, die heute allen ChatGPT-Benutzern zur Verfügung steht.
„Der erweiterte Sprachmodus von ChatGPT kann emotionale und nonverbale Hinweise verstehen und darauf reagieren und bringt uns näher an natürliche Gespräche in Echtzeit mit künstlicher Intelligenz“, schreibt OpenAI. „Unsere Mission ist es, Ihnen diese neuen Erfahrungen durchdacht zu vermitteln.“
Auf der Bühne beim Start demonstrierten OpenAI-Mitarbeiter die sofortige Reaktion von ChatGPT auf Anfragen, beispielsweise das Lösen einer mathematischen Aufgabe auf einem Blatt Papier vor der Smartphone-Kamera eines Forschers.
Der erweiterte Sprachmodus von OpenAI hat viele Kontroversen ausgelöst, da die Standardstimme „Sky“ der Stimme der Schauspielerin Scarlett Johansson ähnelt. Johnson gab später eine Erklärung ab, in der es hieß, sie habe einen Rechtsbeistand beauftragt, Fragen zur Stimme zu stellen und genaue Einzelheiten zu deren Entwicklung zu erfahren – und dass sie mehrere Anfragen von OpenAI abgelehnt habe, ihr die Erlaubnis zu geben, ChatGPT zu sprechen.
OpenAI bestritt, Johnsons Stimme ohne Erlaubnis oder eine ähnliche Erlaubnis verwendet zu haben, entfernte die beleidigende Stimme jedoch später.