Jedes neue Video, das die Fähigkeiten von chatgpt Voice zeigt, macht mich noch neugieriger, es selbst auszuprobieren, und das neueste ist da keine Ausnahme. Darin sehen wir, wie die KI basierend auf einer einfachen Sprachaufforderung eine Reihe verschiedener Charakterstimmen annimmt – perfekt zum Geschichtenerzählen.

Es ist unklar, wann die nächste Version von ChatGPT Voice, auch bekannt als Omni Voice, verfügbar sein wird, aber Gerüchte deuten darauf hin, dass Erstanwender später im Sommer Zugriff haben werden.

Im Gegensatz zur aktuellen Version von ChatGPT Voice basiert dieses neue Modell auf GPT-4o und ist nativ Speech-to-Speech, d. h. es muss das, was Sie sagen, nicht zuerst in Text umgewandelt werden.

Diese native Stimmmodalität ermöglicht es dem Modell, anders klingende Stimmen zu erzeugen, Emotionen auszudrücken und sogar Anzeichen von Emotionen in Ihrer Stimme zu erkennen, während Sie mit ihr sprechen.

Was zeigt die neue ChatGPT-Demo?

YouTube Video

OpenAI hat nach und nach die Vielzahl der Funktionen enthüllt, die im neuen Sprachmodus von GPT-4o verborgen sind. Bisher haben wir gesehen, dass es Gespräche in Echtzeit übersetzt, bei Hausaufgaben hilft und sogar ein Publikum auf einer französischen Technologiekonferenz begrüßt.

In der neuesten Demo beginnt es damit, dass ein OpenAI-Mitarbeiter dem KI-Chatbot Anweisungen gibt. Er erzählt der KI, dass er eine Geschichte schreibt und einige Stimmen für verschiedene Charaktere üben möchte. Einer ist ein Löwe und ChatGPT zeigt eine schroffe, majestätische Stimme.

ChatGPT leistet hervorragende Arbeit mit dem Löwen und ist dann in der Lage, schnell zum zweiten Charakter überzugehen, bei dem es sich um eine „Maus, die sich in eine Höhle geschlichen hat“ handelt.

Siehe auch  Android: ChatGPT kann Google Assistant auf Android-Telefonen ersetzen. Hier erfahren Sie, wie

Was wirklich interessant war, war, wie er die KI dazu bringen konnte, die Stimme zu ändern und ihr zu sagen, sie solle „ein bisschen quietschender sein, wie eine winzige kleine Maus“.

Dann fügte er weitere Charaktere hinzu, wie zum Beispiel eine Eule, die weise schien und als Berater des Löwen fungierte, und einen bösen Charakter mit einem bösen Lachen. ChatGPT lachte wahnsinnig! Er schuf einen kompletten Satz an Charakteren, die er in der Geschichte verwenden konnte.

Insgesamt hat er großartige Arbeit geleistet und gibt uns einen Einblick, wie ChatGPT möglicherweise dazu verwendet werden könnte, in einem D&D-Spiel als Dungeon-Meister zu fungieren oder Hörbücher durch benutzerdefinierte, handgenerierte interaktive Geschichten zu ersetzen.

Wann wird ChatGPT Voice verfügbar sein?

Chatgpt-4O-Logo Auf Dem Telefon

OpenAI möchte darauf hinweisen, dass der Sprachmodus zwar bereits für alle Benutzer in der ChatGPT-App verfügbar ist, die „neuen Sprach- und visuellen Funktionen mit GPT-4o jedoch in den kommenden Wochen eingeführt werden“.

Einige Benutzer haben begonnen, den neuen Modus Omni Voice oder GPT-4o Voice zu nennen. Die im neuen Video gezeigten Funktionen sind nur mit GPT-4o Voice und Vision verfügbar. Einige Benutzer werden in den kommenden Monaten Zugriff darauf haben.

Wenn Sie zur iphone– oder Android-App gehen und in den Sprachmodus wechseln, können Sie sehen, welche Version Sie verwenden, indem Sie oben rechts auf das Symbol (i) klicken. Wenn Sie die aktuelle Version verwenden, sollte die neue ChatGPT-Stimme „bald verfügbar“ lauten.

Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein