Sam Altman, CEO und Mitbegründer von OpenAI, gab am Donnerstag auf X (ehemals Twitter) bekannt, dass die Advanced Voice-Funktion „nächste Woche“ eingeführt wird, allerdings nur für einige ausgewählte chatgpt-Plus-Abonnenten.
Das Unternehmen plant, „die Alpha-Version mit einer kleinen Gruppe von Benutzern zu starten, um Feedback zu sammeln und sie auf Grundlage unserer Erkenntnisse zu erweitern.“
Die Alpha-Einführung für Plus-Abonnenten beginnt nächste Woche!
– Sam Altman (@sama) 25. Juli 2024
Holen Sie sich Microsoft Office für Windows/Mac für 25 $
$229 Sparen Sie $204
Lebenslanger Zugriff auf Word, Excel, PowerPoint, Outlook, OneNote, Publisher und Access.
$229 Sparen Sie $204
Advanced Voice, das auf die Texteingabe verzichtet und es Benutzern ermöglicht, direkt mit der KI zu sprechen, als ob es ein anderer Mensch wäre, wurde ursprünglich im Mai zusammen mit der Veröffentlichung von GPT-4o während des Spring Update-Events des Unternehmens angekündigt. Im Gegensatz zu bestehenden digitalen Assistenten wie Siri und google Assistant, die nur vorgefertigte Antworten auf Benutzeranfragen liefern, bietet Advanced Voice von ChatGPT menschenähnliche Antworten, nahezu latenzfrei und in mehreren Sprachen.
Das Modell GPT-4o kann auf Audioeingaben reagieren in durchschnittlich 320 Millisekundenwas vergleichbar ist mit der Geschwindigkeit, mit der Menschen auf normale Gespräche reagieren. Wie Sie im Demo-Video unten sehen können, kann das Modell mit mehreren Benutzern gleichzeitig kommunizieren, Gesprächsthemen und Fragen sowohl auf Englisch als auch auf Portugiesisch improvisieren und diese mit menschlichen Emotionen, einschließlich „Lachen“, übermitteln.
Eine neue Sprache lernen mit dem erweiterten Sprachmodus von ChatGPT
Es gibt noch keine Informationen darüber, wie das Unternehmen Teilnehmer für die Alpha-Testversion auswählen wird, abgesehen davon, dass es sich um Abonnenten der ChatGPT Plus-Stufe für 20 $/Monat handelt. Die Alpha-Version war ursprünglich für Juni geplant, dieser Termin wurde jedoch verschoben, „um unsere Startschwelle zu erreichen“ und die Fähigkeit zu verbessern, verbotene Formen von Inhalten zu erkennen und abzulehnen, sowie die IT-Infrastruktur des Unternehmens zu stärken, um der erwarteten Zunahme der Benutzerlast gerecht zu werden.
Wie das Unternehmen im Juni mitteilte, wird die vollständige Einführung der Funktion frühestens im Herbst erfolgen. Der genaue Zeitpunkt hängt wiederum davon ab, ob die Funktion „unsere hohen Sicherheits- und Zuverlässigkeitsstandards erfüllt“.
ChatGPT die Möglichkeit zu geben, auf natürliche Weise mit seinen Benutzern zu kommunizieren, ist ein enormer Fortschritt. Durch den Wegfall der Notwendigkeit eines Kontextfensters werden die Hardwareanforderungen der Benutzer reduziert und die potenziellen Integrationen und Anwendungsfälle für KI erweitert (z. B. die Verbesserung des Zugriffs für Benutzer mit eingeschränkter Körperbeweglichkeit oder Geschicklichkeit).
Dies kann auch dazu beitragen, dass die Technologie schneller von der breiten Öffentlichkeit angenommen wird, indem die Einstiegshürde für technisch weniger versierte Benutzer gesenkt wird, die zwar gerne über „Hey Siri“ mit ihrem Computer interagieren, aber vor der Aussicht auf eine schnelle technische Umsetzung zurückschrecken.