Das kalifornische Start-up OpenAI gab am Montag bekannt, dass es sein Programm für künstliche Intelligenz (KI) chatgpt mit Sprache und Vision ausstatten wird, um es „intuitiver“ zu machen.

Die Schnittstelle, die die generative KI populär gemacht hat (die in der Lage ist, auf einfache Anfrage Texte, Bilder und andere Inhalte in Alltagssprache zu produzieren), wird bald in der Lage sein, Anfragen mit Bildern zu verarbeiten und auch mündlich mit ihren Benutzern zu chatten.

Diese neuen Tools werden in den nächsten zwei Wochen bereitgestellt

Sie können beispielsweise ein Foto von einem Denkmal machen und „mit ChatGPT ein Gespräch über die Geschichte des Gebäudes führen“ oder der Software sogar zeigen, was sich in ihrem Kühlschrank befindet, damit diese ein Rezept vorschlagen kann, schlägt vor OpenAI in einer Pressemitteilung. Diese neuen Tools werden in den nächsten zwei Wochen für Abonnenten von ChatGPT Plus, der kostenpflichtigen Version des Chatbots, oder Kundenorganisationen des Dienstes bereitgestellt.

Das Unternehmen kündigte die bevorstehende Hinzufügung solcher Funktionen im vergangenen März an, als GPT-4 vorgestellt wurde, die neueste Version seines Sprachmodells, der Technologie, die chatGPT zugrunde liegt. GPT-4 ist multimedial in dem Sinne, dass es andere Daten als Text oder Computercode verarbeiten kann.

Der Erfolg von ChatGPT seit Ende 2022 hat zu einem großen Wettlauf um generative KI zwischen Technologiegiganten geführt, mit google und Microsoft an der Spitze. Aber auch die schnelle Einführung dieser noch sehr schlecht regulierten Programme gibt Anlass zu großer Sorge, zumal sie dazu neigen, zu „halluzinieren“, also Antworten von Grund auf zu erfinden.

Siehe auch  Der ChatGPT-Hersteller spielt die Befürchtungen herunter, dass er Europa wegen der KI-Regeln verlassen könnte

Spotify gibt Partnerschaft mit OpenAI bekannt

„Modelle mit Vision stellen neue Herausforderungen dar, von Halluzinationen bis hin dazu, dass sich Menschen in wichtigen Bereichen auf die Interpretation von Bildern durch das Programm verlassen müssen“, räumte OpenAI in seiner Erklärung am Montag ein.

Das Start-up behauptet, das Modell zu Themen wie Extremismus und wissenschaftlichen Erkenntnissen „getestet“ zu haben und setzt bei der Verbesserung auf reale Anwendungen und Benutzerfeedback.

Es schränkte die Fähigkeiten von ChatGPT zur „Analyse von Personen“ weiter ein, da die Schnittstelle „nicht immer genau ist und diese Systeme die Privatsphäre von Einzelpersonen respektieren müssen“.

Auch die Streaming-Plattform Spotify gab am Montag eine Partnerschaft mit OpenAI bekannt, um Podcasts direkt mit KI zu übersetzen. Auf Englisch aufgezeichnete Sendungen werden nun in anderen Sprachen verfügbar sein, „unter Beibehaltung der charakteristischen Stimmmerkmale des Sprechers“, heißt es in einer Erklärung des Dienstes.

Das schwedische Unternehmen versichert, dass die neue Spracherzeugungstechnologie von OpenAI „den Stil des Originalsprechers reproduziert und so ein authentischeres, persönlicheres und natürlicheres Hörerlebnis als herkömmliche Synchronisation ermöglicht“.

5/5 - (291 votes)
Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein