OpenAIs chatgpt-Sprachassistent versucht eindeutig, den Trend bei Sprachbefehlen voranzutreiben.
In einem online veröffentlichten Beispiel des voraussichtlich aktualisierten erweiterten Sprachmodus von ChatGPT, Redditor Abonnieren zeigte, wie die neue Sprachoption klingt und wie Soundeffekte in die Antworten integriert werden können. Nicht nur die Stimme ist unglaublich realistisch, sondern es gibt auch gut getimte Gewittergeräusche im Hintergrund, die für ein noch tieferes Eintauchen sorgen.
Wir waren bereits beeindruckt, als OpenAI Anfang des Jahres sein GPT-4o-Update vorstellte und seinen KI-Assistenten zeigte, der mathematische Probleme löste und singte. Das Unternehmen begeisterte uns jedoch weiterhin mit Demos, die auf es ist YouTubewo wir sehen können, wie ChatGPT Geschichten erfindet mit mehrere Charaktere und verschiedene Stimmen und sogar zwei Instanzen von GPT-4o, die miteinander interagieren. Dieses neueste durchgesickerte Update mit Soundeffekten zeigt uns, dass OpenAIs ChatGPT noch mehr Anwendungsfälle hat, als wir zunächst angenommen haben.
Ein vielversprechender Rohentwurf
Beim Anhören der Audioprobe ähnelten die Soundeffekte in etwa dem Klang eines echten Gewitters. Da dieses Leck wahrscheinlich auf eine versehentliche Veröffentlichung zurückzuführen ist, erhalten wir möglicherweise eine verfeinerte Version, sobald OpenAI schließlich seinen erweiterten Sprachmodus veröffentlicht. Trotzdem ist klar, wie einige Soundeffekte etwas Geheimnisvolles und Dramatisches für die zufällige Geschichte erzeugen, die Sie von ChatGPT erstellen lassen.
Angesichts all der KI-Leistungen, die wir bisher gesehen haben, mag dies zunächst einmal sehr simpel erscheinen. Bedenken Sie jedoch, dass der KI-Chatbot intelligent genug war, einen passenden Soundbyte zu erstellen und ihn zeitlich so abzustimmen, dass ein maximales Eintauchen möglich ist, und dabei seine Antwort mit einer unglaublich menschenähnlichen Stimme übermittelte.
Die zusätzliche Möglichkeit, Soundeffekte zu erstellen, wäre für viele Anregungen perfekt, beispielsweise zum Erstellen einer Gutenachtgeschichte für Ihr Kind oder zum Umwandeln von einfachem Text in ein ansprechenderes und individuelleres Hörbuch. Ein Redditor schlug sogar vor, dass es Ihren Dungeon Master während einer Dungeons & Dragons-Kampagne ersetzen könnte. Hier mangelt es nicht an Möglichkeiten und es besteht kein Zweifel, dass OpenAI diese Funktion in Zukunft verbessern könnte.
Noch nicht zur Veröffentlichung bereit
Obwohl wir dank dieses Reddit-Leaks einen kleinen Vorgeschmack auf den erweiterten Sprachmodus von ChatGPT bekommen haben, sieht es nicht so aus, als wäre er schon für eine offizielle Veröffentlichung bereit. Sogar der Redditor, der über den neuen Modus gestolpert ist, sagte, der Sprachassistent habe kurz nach dem Ende des Beispiel-Audios den Geist aufgegeben. Darüber hinaus hat OpenAI kürzlich angekündigt, dass es musste verzögern die Einführung des erweiterten Sprachmodus, da mehr Zeit zum Testen benötigt wurde.
Das neueste Update des Unternehmens wurde durch rechtliche Probleme noch komplizierter; Schauspieler Scarlett Johansson drohte mit einer Klage gegen OpenAI aufgrund der Ähnlichkeit der inzwischen entfernten Sky-Option mit der Stimme des Schauspielers.
Wie dem auch sei, der neueste Teaser des neuen Sprachmodus von OpenAI gibt uns einen Einblick in die Zukunft fortgeschrittenerer großer Sprachmodelle, die KI-Chatbots antreiben, und wie sie Spracheingaben ergänzen könnten. Schnallt euch an, denn es wird noch seltsamer.