OpenAI hat damit begonnen, den erweiterten Sprachmodus (Voice Mode) für eine kleine Anzahl von ChatGPT Plus-Benutzern einzuführen, der natürlichere Sprachgespräche in Echtzeit ermöglicht. Solche KI-Assistenten können auch die Emotionen der Benutzer erkennen und darauf reagieren.
Seit der Veröffentlichung des GPT-4o-Modells und der Demonstration erweiterter Sprachmodi hat OpenAI die Sicherheit und Qualität von Sprachgesprächen kontinuierlich verbessert. OpenAI plant, die Alpha-Testversion für den Sprachmodus im Herbst allen ChatGPT Plus-Benutzern zur Verfügung zu stellen. Die Video- und Bildschirmfreigabefunktionen werden voraussichtlich noch in diesem Jahr eingeführt, ein Veröffentlichungsdatum steht jedoch noch nicht fest.
OpenAI hat Red-Team-Übungen mit mehr als 100 externen Mitgliedern zur ChatGPT-Sprachfunktion von GPT-4o durchgeführt, die bis zu 45 Sprachen umfassten. Um die Privatsphäre der Benutzer zu schützen, bietet das von OpenAI trainierte Modell nur 4 voreingestellte Töne, und es wurde ein spezielles System eingerichtet, um zu verhindern, dass die Sprachausgabe von den voreingestellten Tönen abweicht. OpenAI schlägt außerdem Schutzmaßnahmen vor, um Sprachanfragen für gewalttätige oder urheberrechtlich geschützte Inhalte zu blockieren .
„Durch eine schrittweise Einführung können wir die Nutzung genau überwachen und die Funktionalität und Sicherheit des Modells basierend auf realem Feedback kontinuierlich verbessern“, sagte OpenAI.
Wir beginnen damit, den erweiterten Sprachmodus für eine kleine Gruppe von ChatGPT Plus-Benutzern einzuführen. Der erweiterte Sprachmodus bietet natürlichere Gespräche in Echtzeit, ermöglicht es Ihnen, jederzeit zu unterbrechen, und erkennt und reagiert auf Ihre Emotionen. pic.twitter.com/64O94EhhXK
— OpenAI (@OpenAI) 30. Juli 2024
▲ OpenAI beginnt mit der Einführung des erweiterten Sprachmodus für eine kleine Anzahl von ChatGPT Plus-Benutzern.
Mit der Unterstützung von GPT-4o zeigt die ChatGPT-Sprachfunktion das enorme Potenzial der KI-Konversationsinteraktion. Aufgrund der Proteste der Hollywood-Schauspielerin Scarlett Johansson hat OpenAI jedoch die umstrittene Sky-Stimme entfernt, was den Fortschritt des ursprünglichen Plans, Ende Juli mit den Tests zu beginnen, beeinträchtigen könnte.
das ist ein cooles Ding!
Wir werden die Funktion schnell verbessern. https://t.co/8TYnQ1VXKw
– Sam Altman (@sama) 1. August 2024
▲ Der CEO von OpenAI hat einen sehr interessanten Sprachmodustest geteilt. Beim Zählen von 1 bis 50 stoppt es und atmet wie ein Mensch.
(Quelle des ersten Bildes:pixabay)
Weiterführende Literatur:
Neue wissenschaftliche und technologische Erkenntnisse, die von Zeit zu Zeit aktualisiert werden