Ihre Gespräche mit chatgpt werden viel persönlicher.

OpenAI, der Erfinder von ChatGPT, angekündigt gestern (Montag) bekannt gegeben, dass in den nächsten zwei Wochen neue Sprach- und Bildfunktionen für den KI-Chatbot eingeführt werden.

Diejenigen, die für ein ChatGPT Plus-Abonnement bezahlen, sowie Enterprise-Benutzer werden bald in der Lage sein, hin und her Gespräche zu führen ChatGPT. Wer die kostenlose Version nutzt, ist weiterhin auf die Texteingabe beschränkt. Die Sprachfunktionen umfassen eine Reihe menschlicher Stimmen, die von echten Synchronsprechern erzeugt werden. Ein neuer Text zu Sprache Das Modell gepaart mit dem Open-Source-Spracherkennungssystem Whisper wird diese lebensechten Gespräche ermöglichen.

OpenAI hat sicherlich sein Bestes gegeben, als es kurze Beispiele dafür veröffentlichte, wie die neuen Stimmen von ChatGPT klingen, als würden sie ein Gedicht oder eine Rede lesen. Sie stellen einen hörbaren Fortschritt gegenüber den generischen KI-Stimmen dar, die manche Websites bereitstellen, um ihre lange gelesenen Stücke (automatisch) vorzutragen.

Probleme haben die richtigen Worte finden beim Gespräch mit ChatGPT? Das zweite große Upgrade, das ansteht, ist die Bild-Chat-Funktionalität. Wenn Sie für einen Moment die Kunststoff- oder Metallspitzen der besten Laufschuhe vergessen, werden die Schnürsenkel Aglets genannt dringend Sie müssen ChatGPT fragen, ob sie ersetzt werden können. Machen Sie einfach ein Foto und senden Sie es an den Chat. Sie können mehrere Bilder besprechen oder das Zeichentool verwenden, um die KI zu dem spezifischen Teil eines Bildes zu führen, auf den Sie sich beziehen.

Die Verarbeitung der Bilder wird laut OpenAI durch GPT-3.5- und GPT-4-Modelle unterstützt, die ihre Sprachkompetenzen auf verschiedene Bildtypen wie Fotos, Screenshots und Dokumente anwenden können, die sowohl Text als auch Bilder enthalten.

Siehe auch  Könnte ChatGPT eine kognitive Prothese sein?

Absichtlich verdummt

(Bildnachweis: Shutterstock)

In seiner Ankündigung zu diesen neuen Funktionen räumte OpenAI ein, dass sie die Möglichkeit schaffen, dass Menschen versuchen, sich als Persönlichkeiten des öffentlichen Lebens auszugeben oder Betrug zu begehen.

„Aus diesem Grund nutzen wir diese Technologie für einen bestimmten Anwendungsfall – Voice-Chat. Der Voice-Chat wurde mit Synchronsprechern erstellt, mit denen wir direkt zusammengearbeitet haben“, sagte OpenAI.

Bei der Bildverarbeitung sei die Fähigkeit von ChatGPT, Personen auf Fotos zu analysieren und Aussagen über sie zu treffen, gezielt eingeschränkt worden, „da ChatGPT nicht immer genau ist und diese Systeme die Privatsphäre des Einzelnen respektieren sollten“, so das Unternehmen.

Sprach- und Bildfunktionen werden in den nächsten zwei Wochen für ChatGPT Plus- und Enterprise-Benutzer bereitgestellt. Die Stimme wird verfügbar sein für iOS und Android Benutzer, sofern sie sich dafür anmelden. Bildfunktionen können auf allen Plattformen genutzt werden.

Mehr von Tom’s Guide

Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein