chatgpt sorgte beim ersten Start für Aufsehen, doch seitdem arbeitet OpenAI hart daran, den Service zu verbessern und neue Funktionen einzubauen. Jetzt hat das Unternehmen eines der bisher bedeutendsten Updates für ChatGPT veröffentlicht.
Auf ihren Websites kann OpenAI nun bekannt geben, dass der beliebte sprechende Roboter die Fähigkeit dazu erlangt hat sprechen. Dies ist jedoch nicht die einzige Neuigkeit, denn ChatGPT kann jetzt auch Bilder erkennen – und diskutieren.
Die neuen Funktionen werden in den nächsten Wochen für Plus- und Enterprise-Benutzer des Dienstes und kurz danach für andere Benutzer bereitgestellt. Die sprachbasierte Kommunikation wird auch auf den mobilen Plattformen iOS und Android Einzug halten, während die Bilderkennung auf allen Plattformen Einzug halten wird.
Professionelle Synchronsprecher
OpenAI hat nicht angegeben, welche Sprachen die neuen Funktionen über Englisch hinaus unterstützen, daher ist ungewiss, ob und wann die Unterstützung für Norwegisch von Anfang an vorhanden sein wird oder möglicherweise später kommt. Norwegisch gehört zu den Sprachen, die ChatGPT offiziell für die Textkommunikation unterstützt.
Durch die Unterstützung der Sprachkommunikation können Sie jetzt mit ChatGPT auf die gleiche Weise kommunizieren wie mit anderen Menschen und eine natürliche Konversation führen.
So wie Sie ChatGPT heute bitten können, ein Gedicht oder eine Geschichte zu schreiben, können Sie sich die Gedichte oder Geschichten jetzt auch in mündlicher Form zusenden lassen. OpenAI gibt an, bei der Erstellung der Stimmen mit professionellen Synchronsprechern zusammengearbeitet zu haben.
Die Funktion basiert auf einem völlig neuen Text-to-Speech-Modell, das in der Lage ist, aus Text und nur wenigen Sekunden Sprache menschenähnliches Audio zu erzeugen. Es verwendet Whisper auch für die Sprach-zu-Text-Transkription. Flüstern, die im vergangenen September eingeführt wurdeist ein Modell zur Spracherkennung, das unter anderem für Übersetzungen, Transkriptionen und Speech-to-Text eingesetzt werden kann.
Kann jetzt auch Bilder analysieren
Die andere Neuigkeit ist vielleicht noch interessanter, nämlich die neue Bilderkennungsfunktion. Mit dieser Funktion kann ChatGPT Bilder analysieren, die der Benutzer dem sprechenden Roboter zeigt, und aussagekräftige Rückmeldungen und Beschreibungen dessen erstellen, was er sieht.
Diese Funktion kann beispielsweise verwendet werden, um ChatGPT zu bitten, Ihnen bei der Reparatur von Produkten zu helfen, die Sie möglicherweise nicht ganz selbst reparieren können. Indem Sie dem sprechenden Roboter einfach ein Bild von dem zeigen, woran Sie gerade arbeiten, kann er auf der Grundlage dessen, was auf dem Bild zu sehen ist, darauf reagieren, wie Sie vorgehen sollten.
In einem von OpenAI geposteten Beispiel wurde ChatGPT ein Bild eines Werkzeugkastens gezeigt und auf dieser Grundlage konnte ChatGPT die richtigen Werkzeuge für eine bestimmte Aufgabe identifizieren, an der der Benutzer arbeitete – in diesem Fall die Einstellung eines Fahrradsitzes. Die Bilder können einfach mit der mobilen Kamera aufgenommen und in der mobilen App-Version von ChatGPT in das Gespräch eingefügt werden.
Weitere Informationen zu den neuen Funktionen finden Sie unter Website von OpenAI.