Das Unternehmen hinter chatgpt gab am Montag bekannt, dass es der Plattform für generative künstliche Intelligenz (KI) Sprach- und Bildfunktionen hinzufügt, die lange Zeit auf schriftliche Eingabeaufforderungen beschränkt waren.

Durch das Hinzufügen von Funktionen zu kostenpflichtigen Versionen des Dienstes können Benutzer laut OpenAI Gespräche mit der KI führen und ihr sogar „zeigen“, worüber sie sprechen.

„Sprache und Bild bieten Ihnen mehr Möglichkeiten, ChatGPT in Ihrem Leben zu nutzen“, sagte OpenAI in einem Beitrag.

„Machen Sie auf Reisen ein Foto von einem Wahrzeichen und führen Sie ein Live-Gespräch darüber, was daran interessant ist.“

Beispiele dafür, wie die neuen Funktionen genutzt werden könnten, waren das Fotografieren des Inneren eines Kühlschranks, um Rezeptvorschläge für Mahlzeiten zu erhalten, oder ein Foto der Mathe-Hausaufgaben eines Kindes, um Hilfe bei der Lösung von Problemen zu erhalten.

Laut Open AI werden Sprach- und Bildfunktionen im Laufe der kommenden Wochen für ChatGPT Plus- und Enterprise-Benutzer bereitgestellt und sollen schließlich auch für die Smartphone-Betriebssysteme von apple und google verfügbar sein.

„Sie können jetzt die Stimme verwenden, um mit Ihrem Assistenten ein Gespräch zu führen“, sagte der ChatGPT-Ersteller.

„Sprechen Sie unterwegs damit, fordern Sie eine Gute-Nacht-Geschichte für Ihre Familie an oder schlichten Sie eine Tischdebatte.“

Nach Angaben des Startups arbeitete OpenAI mit Synchronsprechern zusammen, um gesprochene Interaktionen realistischer zu gestalten.

Generative KI-Programme rückten Ende letzten Jahres ins Rampenlicht, wobei ChatGPT seine Fähigkeit unter Beweis stellte, aus den kürzesten Eingabeaufforderungen Aufsätze, Gedichte und Gespräche zu generieren.

Die Tech-Titanen Google, Meta und Microsoft wetteifern darum, das Versprechen der generativen KI zu nutzen und gleichzeitig Gefahren wie das Potenzial der Technologie als Waffe für Fehlinformationen und Cyberkriminalität zu vermeiden.

Siehe auch  Die ChatGPT-App kann in Taiwan mit iOS 16.1 und höher heruntergeladen werden

In einer separaten Ankündigung gab die in Schweden ansässige Musik-Streaming-Plattform Spotify am Montag bekannt, dass sie die Vorteile der OpenAI-Technologie nutzt, um die Übersetzung von Podcasts in verschiedene Sprachen zu ermöglichen und dabei den Stil des ursprünglichen Sprechers beizubehalten.

„Durch die Anpassung an die eigene Stimme des Erstellers gibt Voice Translation Hörern auf der ganzen Welt die Möglichkeit, neue Podcaster authentischer als je zuvor zu entdecken und sich von ihnen inspirieren zu lassen“, sagte Ziad Sultan, Vizepräsident für Personalisierung bei Spotify, in einer Pressemitteilung.

Nach Angaben des Unternehmens startet Spotify in den kommenden Wochen mit der Übersetzung englischsprachiger Episoden ins Spanische, Französische und Deutsche.

5/5 - (100 votes)
Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein