Künstliche Intelligenz

Die Funktion wird in den kommenden Wochen verfügbar sein und soll es ermöglichen, vom Chatbot produzierte Audiodaten in verschiedenen Stimmen zu „lesen“.

Bloomberg

Das Startup für künstliche Intelligenz OpenAI wird eine neue Funktion für die chatgpt-Anwendung einführen, die es dem Chatbot ermöglicht, Fragen und Befehle mit fünf Sprachmöglichkeiten zu beantworten.

Benutzer können innerhalb von zwei Wochen ihre Stimme in der Chatbot-App auswählen und dabei eine von fünf verfügbaren Persona-Optionen mit Namen wie „Juniper“, „Breeze“ und „Ember“ wählen. ChatGPT produziert dann Audio des Textes mit der von Ihnen gewählten Stimme – zum Beispiel das Vorlesen einer KI-generierten Gute-Nacht-Geschichte. Die Funktion steht Abonnenten des 20-Dollar-ChatGPT-Plus-Dienstes von OpenAI oder der Enterprise-Option zur Verfügung.

OpenAI hat ChatGPT im Mai eingeführt und bietet bereits eine Voice-to-Text-Option, die es Benutzern ermöglicht, mit dem Bot zu sprechen. Das Hinzufügen einer Audioantwortfunktion könnte den Eindruck erwecken, dass Benutzer ein menschlicheres Gespräch führen. Das Unternehmen hofft, dass die neue Lösung die Nutzung der mobilen App unterwegs fördern und ChatGPT näher an persönliche Assistenten wie google Assistant, Apples Siri oder Amazons Alexa bringen wird.

FORTSETZUNG NACH DER WERBUNG

IM-Geschäft Newsletter

Möchten Sie über die wichtigsten Neuigkeiten, die die Geschäftswelt bewegen, auf dem Laufenden bleiben? Melden Sie sich an und erhalten Sie neue InfoMoney Business-Benachrichtigungen per E-Mail.

Gettyimages 1457120960
(Getty Images)

Zu den Befehlen kann gehören, das Programm zu bitten, auf dem Weg zum Freizeitpark über die Geschichte von Disneyland zu sprechen, oder nach einem Getränkerezept zu fragen, während man in der Küche nach etwas sucht. In einem Test erzählte das Tool eine Geschichte über einen Seestern und eine Steckrübe (eine rübenähnliche Wurzel). ChatGPT weigert sich jedoch zu singen, egal wie gut die App Liedtexte erstellen kann.

Siehe auch  ChatGPT geht davon aus, dass Shiba Inu das 0,1-Dollar-Ziel erreichen könnte

Die Stimme von ChatGPT klingt ähnlich wie die eines Menschen (obwohl sie sich bei genauem Hinhören als etwas roboterhaft und eintönig herausstellt). OpenAI sagt, dass es mit Synchronsprechern zusammenarbeitet, um das Text-zu-Audio-Modell der Funktion zu entwickeln.

Das Unternehmen sagte außerdem, dass zahlende Benutzer und Unternehmen in den kommenden Wochen auf eine Funktion in GPT-4 – einem der künstlichen Intelligenzmodelle, die ChatGPT antreiben – zugreifen können, um ein Bild und eine damit verbundene Frage zu senden. Beispielsweise ist es möglich, ein Bild einer rosa Brille hochzuladen und den Chatbot zu bitten, passende Kleidung vorzuschlagen, oder ein Foto eines mathematischen Problems zu senden und den Chat zu bitten, es zu lösen. Die von OpenAI beim Start von GPT-4 angekündigte Lösung wird auf der ChatGPT-Website und -App verfügbar sein.

Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein