Künstliche Intelligenz
Die Funktion wird in den kommenden Wochen verfügbar sein und soll es ermöglichen, vom Chatbot produzierte Audiodaten in verschiedenen Stimmen zu „lesen“.
Bloomberg
Das Startup für künstliche Intelligenz OpenAI wird eine neue Funktion für die chatgpt-Anwendung einführen, die es dem Chatbot ermöglicht, Fragen und Befehle mit fünf Sprachmöglichkeiten zu beantworten.
Benutzer können innerhalb von zwei Wochen ihre Stimme in der Chatbot-App auswählen und dabei eine von fünf verfügbaren Persona-Optionen mit Namen wie „Juniper“, „Breeze“ und „Ember“ wählen. ChatGPT produziert dann Audio des Textes mit der von Ihnen gewählten Stimme – zum Beispiel das Vorlesen einer KI-generierten Gute-Nacht-Geschichte. Die Funktion steht Abonnenten des 20-Dollar-ChatGPT-Plus-Dienstes von OpenAI oder der Enterprise-Option zur Verfügung.
OpenAI hat ChatGPT im Mai eingeführt und bietet bereits eine Voice-to-Text-Option, die es Benutzern ermöglicht, mit dem Bot zu sprechen. Das Hinzufügen einer Audioantwortfunktion könnte den Eindruck erwecken, dass Benutzer ein menschlicheres Gespräch führen. Das Unternehmen hofft, dass die neue Lösung die Nutzung der mobilen App unterwegs fördern und ChatGPT näher an persönliche Assistenten wie google Assistant, Apples Siri oder Amazons Alexa bringen wird.
Zu den Befehlen kann gehören, das Programm zu bitten, auf dem Weg zum Freizeitpark über die Geschichte von Disneyland zu sprechen, oder nach einem Getränkerezept zu fragen, während man in der Küche nach etwas sucht. In einem Test erzählte das Tool eine Geschichte über einen Seestern und eine Steckrübe (eine rübenähnliche Wurzel). ChatGPT weigert sich jedoch zu singen, egal wie gut die App Liedtexte erstellen kann.
Die Stimme von ChatGPT klingt ähnlich wie die eines Menschen (obwohl sie sich bei genauem Hinhören als etwas roboterhaft und eintönig herausstellt). OpenAI sagt, dass es mit Synchronsprechern zusammenarbeitet, um das Text-zu-Audio-Modell der Funktion zu entwickeln.
Das Unternehmen sagte außerdem, dass zahlende Benutzer und Unternehmen in den kommenden Wochen auf eine Funktion in GPT-4 – einem der künstlichen Intelligenzmodelle, die ChatGPT antreiben – zugreifen können, um ein Bild und eine damit verbundene Frage zu senden. Beispielsweise ist es möglich, ein Bild einer rosa Brille hochzuladen und den Chatbot zu bitten, passende Kleidung vorzuschlagen, oder ein Foto eines mathematischen Problems zu senden und den Chat zu bitten, es zu lösen. Die von OpenAI beim Start von GPT-4 angekündigte Lösung wird auf der ChatGPT-Website und -App verfügbar sein.