Auf dem Weg zu einem chatgpt „intuitiver“ ?OpenAI gab am Montag, 25. September, bekannt, dass es sein Programm für künstliche Intelligenz (KI) mit Sprache und Vision ausstatten werde. Die Schnittstelle, die die generative KI populär gemacht hat (die in der Lage ist, auf einfache Anfrage Texte, Bilder und andere Inhalte in Alltagssprache zu produzieren), wird bald in der Lage sein, Anfragen mit Bildern zu verarbeiten und auch mündlich mit ihren Benutzern zu chatten.
Sie können zum Beispiel ein Foto von einem Denkmal machen und „Führen Sie ein Gespräch mit ChatGPT“ über die Geschichte des Gebäudes informieren oder der Software sogar zeigen, was sich in ihrem Kühlschrank befindet, damit sie ihnen ein Rezept anbieten kann, schlägt OpenAI in einer Pressemitteilung vor. Diese neuen Tools werden in den nächsten zwei Wochen für Abonnenten von ChatGPT Plus, der kostenpflichtigen Version des Chatbots, oder für Kundenorganisationen des Dienstes bereitgestellt.
Das Unternehmen kündigte die bevorstehende Hinzufügung solcher Funktionen im vergangenen März an, als GPT-4 vorgestellt wurde, die neueste Version seines Sprachmodells, der Technologie, die chatGPT zugrunde liegt. GPT-4 ist multimedial in dem Sinne, dass es andere Daten als Text oder Computercode verarbeiten kann.
Programme, die immer noch sehr schlecht reguliert sind
Der Erfolg von ChatGPT seit Ende 2022 hat zu einem großen Wettlauf um generative KI zwischen Technologiegiganten geführt, mit google und Microsoft an der Spitze. Aber auch die schnelle Einführung dieser noch sehr schlecht regulierten Programme gibt Anlass zu großer Sorge, zumal sie dazu tendieren „halluzinieren“das heißt, Antworten von Grund auf neu zu erfinden.
„Modelle mit Vision stellen neue Herausforderungen dar, von Halluzinationen bis hin dazu, dass sich Menschen in wichtigen Bereichen auf die Bildinterpretation des Programms verlassen müssen.“würdigt OpenAI in seiner Pressemitteilung vom Montag.
Das behauptet das Start-up „das Modell getestet“ zu Themen wie Extremismus und wissenschaftlichen Erkenntnissen und verlässt sich zur Verbesserung auf reale Anwendungen und Benutzerfeedback. Dadurch wurden die Funktionen von ChatGPT weiter eingeschränkt „Menschen analysieren“Auto-Schnittstelle „ist nicht immer präzise und [que ses] Systeme müssen die Vertraulichkeit des Einzelnen respektieren“.
Auch die Streaming-Plattform Spotify gab am Montag eine Partnerschaft mit OpenAI bekannt, um Podcasts direkt mit KI zu übersetzen. Auf Englisch aufgezeichnete Shows sind jetzt in anderen Sprachen verfügbar „unter Beibehaltung der charakteristischen stimmlichen Eigenschaften des Sprechers“sagte der Dienst in einer Erklärung.
Das schwedische Unternehmen versichert, dass die neue Spracherzeugungstechnologie von OpenAI „Reproduziert den Stil des Originalsprechers und ermöglicht so ein authentischeres, persönlicheres und natürlicheres Hörerlebnis als herkömmliches Dubbing.“.