chatgpt hat sprechen gelernt.

OpenAI, das Start-up für künstliche Intelligenz aus San Francisco, hat am Montag eine Version seines beliebten Chatbots veröffentlicht, der mit Menschen über gesprochene Worte interagieren kann. Wie bei Amazons Alexa, Apples Siri und anderen digitalen Assistenten können Benutzer mit ChatGPT sprechen und es antwortet.

Erstmals kann ChatGPT auch auf Bilder reagieren. Die Leute können zum Beispiel ein Foto von der Innenseite ihres Kühlschranks hochladen und der Chatbot kann ihnen eine Liste mit Gerichten geben, die sie mit den vorhandenen Zutaten kochen könnten.

„Wir möchten ChatGPT benutzerfreundlicher und hilfreicher machen“, sagte Peter Deng, Vizepräsident für Verbraucher- und Unternehmensprodukte bei OpenAI.

OpenAI hat die Veröffentlichung seiner KI-Tools in den letzten Wochen beschleunigt. Diesen Monat stellte das Unternehmen eine Version seines DALL-E-Bildgenerators vor und integrierte das Tool in ChatGPT.

ChatGPT zog nach seiner Einführung im November Hunderte Millionen Nutzer an, und mehrere andere Unternehmen brachten bald ähnliche Dienste auf den Markt. Mit der neuen Version des Bots übertrifft OpenAI konkurrierende Chatbots wie google Bard und konkurriert gleichzeitig mit älteren Technologien wie Alexa und Siri.

Alexa und Siri bieten seit langem Möglichkeiten zur Interaktion mit Smartphones, Laptops und anderen Geräten über gesprochene Worte. Aber Chatbots wie ChatGPT und Google Bard verfügen über leistungsfähigere Sprachkenntnisse und sind in der Lage, sofort E-Mails, Gedichte und Hausarbeiten zu schreiben und über fast jedes Thema zu diskutieren, das ihnen in den Weg kommt.

OpenAI hat im Wesentlichen die beiden Kommunikationsmethoden kombiniert.

Das Unternehmen betrachtet das Sprechen als eine natürlichere Art der Interaktion mit seinem Chatbot. Es wird argumentiert, dass die synthetischen Stimmen von ChatGPT – Menschen können aus fünf verschiedenen Optionen wählen, darunter männliche und weibliche Stimmen – überzeugender sind als andere, die mit beliebten digitalen Assistenten verwendet werden.

Siehe auch  ChatGPT hat einen Konkurrenten

In den nächsten zwei Wochen, so das Unternehmen, werde die neue Version des Chatbots für alle verfügbar sein, die ChatGPT Plus abonniert haben, einen Dienst, der 20 US-Dollar pro Monat kostet. Allerdings kann der Bot nur dann per Stimme reagieren, wenn er auf iPhones, iPads und Android-Geräten verwendet wird.

Die synthetischen Stimmen des Bots sind natürlicher als viele andere auf dem Markt, können aber dennoch roboterhaft klingen. Wie andere digitale Assistenten kann es mit Homonymen zu kämpfen haben. Als die New York Times das neue ChatGPT fragte, wie man „gym“ buchstabiere, hieß es: „JIM“.

Aber einer der Vorteile eines Chatbots wie ChatGPT besteht darin, dass er sich selbst korrigieren kann. Auf die Antwort „Nein, die andere Art von Fitnessstudio“ antwortete der Bot: „Ah, ich verstehe jetzt, worauf Sie sich beziehen. Der Ort, an dem Menschen Sport treiben und trainieren, heißt GYM.“

Obwohl die Sprachschnittstelle von ChatGPT an frühere Assistenten erinnert, ist die zugrunde liegende Technologie grundlegend anders. ChatGPT basiert hauptsächlich auf einem großen Sprachmodell (LLM), das gelernt hat, Sprache im Handumdrehen zu generieren, indem es riesige Textmengen aus dem Internet analysiert.

Ältere digitale Assistenten wie Alexa und Siri fungierten wie Kommando- und Kontrollzentren, die eine bestimmte Anzahl von Aufgaben ausführen oder Antworten auf eine endliche Liste von Fragen geben konnten, die in ihren Datenbanken programmiert waren, wie zum Beispiel „Alexa, schalte das Licht ein“ oder „Wie ist das Wetter in Cupertino?“ Das Hinzufügen neuer Befehle zu den älteren Assistenten kann Wochen dauern. ChatGPT kann in Sekundenschnelle zuverlässig auf nahezu jede gestellte Frage antworten – auch wenn diese nicht immer richtig ist.

Siehe auch  Klage der Autoren gegen ChatGPT: Die Zukunft der Bildungstechnologie gestalten

Während OpenAI ChatGPT eher in etwas wie Alexa oder Siri verwandelt, verwandeln Unternehmen wie Amazon und apple ihre digitalen Assistenten eher in etwas wie ChatGPT.

Letzte Woche hat Amazon eine Vorschau gezeigt aktualisiertes System für Alexa, das auf eine flüssigere Konversation über „jedes Thema“ abzielt. Es wird teilweise von einem neuen LLM angetrieben und verfügt über weitere Verbesserungen an Tempo und Intonation, um es natürlicher klingen zu lassen, so das Unternehmen.

Apple, das seine Pläne für den Wettbewerb mit ChatGPT nicht öffentlich bekannt gegeben hat, testet laut zwei über das Projekt informierten Personen einen Prototyp seines großen Sprachmodells für zukünftige Produkte.

Bei der Nutzung über das Web sowie auf iphone, iPad und Android-Geräten kann das neue ChatGPT auch auf Bilder reagieren. Anhand eines Fotos, Diagramms oder Diagramms kann eine detaillierte Beschreibung des Bildes bereitgestellt und Fragen zu dessen Inhalt beantwortet werden. Dies könnte ein nützliches Hilfsmittel für Menschen mit Sehbehinderung sein.

OpenAI demonstrierte das Bildtool erstmals im Frühjahr, aber das Unternehmen sagte, es werde es nicht der Öffentlichkeit zugänglich machen, bis die Forscher besser verstanden hätten, wie die Technologie missbraucht werden könnte. Sie befürchteten unter anderem, dass das Tool de facto zu einem Gesichtserkennungsdienst werden könnte, mit dem Personen auf Fotos schnell identifiziert werden können.

Microsoft eingeführt Diese Art von visuellem Suchtool, das auf der Technologie von OpenAI basiert, wurde im Sommer in seinen Bing-Chatbot integriert.

Sandhini Agarwal, ein OpenAI-Forscher, der sich auf Sicherheit und Richtlinien konzentriert, sagte, die neue Version des Bots würde nun Versuche zur Identifizierung von Gesichtern verweigern. Aber es ist darauf ausgelegt, enorm detaillierte Beschreibungen anderer Fotos zu liefern. Auf ein Bild des Hubble-Weltraumteleskops kann es beispielsweise mit Absätzen reagieren, in denen der Inhalt des Fotos detailliert beschrieben wird.

Siehe auch  Der Ersteller von ChatGPT wurde erstmals wegen einer falschen Anschuldigung einer Person verklagt: News ➕1, 08.06.2023

Der Bot kann auch ein Werkzeug für Studierende sein. Anhand eines Bildes einer High-School-Matheaufgabe, die Wörter, Zahlen und Diagramme enthält, kann der Bot die Aufgabe sofort lesen und lösen. Es könnte eine effektive Möglichkeit sein, zu lernen – oder zu betrügen.

Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein