OpenAI fügt seiner Konversations-KI weiterhin neue Fähigkeiten hinzu, die die Menschheit in eine neue Ära echter Mensch-Maschine-Zusammenarbeit geführt haben. Anbindung an das Web, Analyse und Generierung von Bildern, Analyse und Sprachsynthese stehen dem Chatbot nun auch in der kostenpflichtigen Version zur Verfügung.

chatgpt-can-now-see-hear-and-speak“>ChatGPT wird seit Anfang des Jahres durch das LLM-Modell „GPT-4“ vorangetrieben, von dem wir wissen, dass es multimodal ist, dessen visuelle und akustische Fähigkeiten jedoch bisher eingeschränkt und blockiert waren.

In den letzten Tagen hat OpenAI beschlossen, das Potenzial seiner generativen und konversationalen KI noch etwas auszuschöpfen. Auch wenn diese neuen Funktionen derzeit auf zahlende Nutzer der Versionen ChatGPT Plus und ChatGPT Enterprise beschränkt sind. Zur Erinnerung: Für diejenigen, die kostenlos bleiben möchten, bietet der Bing Chat von Microsoft die meisten dieser Funktionen.

Die Rückkehr der WEB-Verbindung

Es begann mit der Wiedereinsetzung einer Funktion, die diesen Sommer kurzzeitig auftauchte, aber schnell entfernt wurde (nachdem kluge Köpfe herausgefunden hatten, dass sie damit über ChatGPT kostenlos auf kostenpflichtige Websites zugreifen konnten): die Konnektivität der KI im WEB! Das GPT-4-Modell, das ChatGPT zugrunde liegt, wurde mit Dokumenten von vor Ende 2021 trainiert. Ohne Internetverbindung könnte die KI Webdokumente nicht nur nicht wirklich analysieren, sondern auch ihre Antworten nicht mit aktuellen Informationen anreichern. Durch die Aktivierung der Einstellung „Mit Bing durchsuchen“ in „Einstellungen und Beta / Beta-Funktionen“ kann die Konversations-KI nun Fragen zu aktuellen Themen und Ereignissen beantworten und eine Verbindung zum Web herstellen, um ihre Analysen zu verfeinern.

Siehe auch  Nervös vor einem Vorstellungsgespräch? ChatGPT kann helfen, zeigt TikTok

Vom Verstehen bis zur Bildergenerierung

Eine weitere wichtige Neuerung: OpenAI hat sich endlich entschieden, das multimodale Potenzial von GPT-4 freizusetzen. ChatGPT basiert ab sofort auf der brandneuen GPT-4V-Iteration seines Basismodells und formalisiert damit den Zugang zur Bildanalyse. Benutzer von ChatGPT Plus können bald (und können dies jetzt auch auf den iOS- und Android-Mobilversionen) Bilder oder mit Bildern illustrierte Fragen einreichen und diese von der KI analysieren und kommentieren lassen. KI kann so handgeschriebene Manuskripte übersetzen, die gezeichnete Kontur eines Algorithmus oder eines Bildschirms in Computercode umwandeln, ein Foto oder Gemälde analysieren und beschreiben, Captchas analysieren und vieles mehr. Darüber hinaus wird OpenAI in Kürze auch seinen spektakulären Bildgenerator „Dall-E 3“ in ChatGPT integrieren (er ist bereits verfügbar auf Bing Image Creator und die Renderings sind wirklich viel beeindruckender als bei Dall-E 2) und konkurrieren ernsthaft mit midjourney, bieten aber mehr Stilvielfalt.

Stimme, um Interaktionen zu erweitern

Eine der großen Stärken der generativen KI besteht darin, dass sie die Mensch-Maschine-Interaktionen revolutioniert, indem sie natürliche Sprache zur Unterstützung dieser Interaktionen macht. Von nun an besteht die Idee darin, solche Interaktionen mit der Stimme statt mit dem Schreiben durchführen zu können. Aufgrund der aktuellen Zeit der Analyse und des Verständnisses der menschlichen Sprache müssen wir noch ein wenig warten, um eine Diskussion wie mit einem Menschen zu führen. Aber wir kommen näher. Mit Bing Chat in der mobilen Version können Sie Fragen per Spracheingabe stellen und die KI kann diese auch per Spracheingabe beantworten. Dabei greift die KI auf von Microsoft entwickelte Modelle zurück. OpenAI wird in Kürze sein Voice-to-Text-Modell „Whisper“ in ChatGPT Plus integrieren. Dank eines neuen „TTS – Text to Speech“-Modells mit 5 verschiedenen Stimmen kann der Chatbot auch sprechen.

Siehe auch  Die Telefone von Samsung könnten nächstes Jahr über eine ChatGPT-ähnliche generative KI verfügen

Mit anderen Worten: ChatGPT kann jetzt eine Verbindung herstellen, sehen, sprechen und hören. So viele neue Funktionen, die clevere kleine Benutzer unbedingt für unvorhergesehene Zwecke nutzen werden, indem sie Spaß daran haben, die Einschränkungen zu umgehen, die OpenAI eingeführt hat, um böswillige oder unangemessene Nutzungen ihrer KI zu verhindern.

Lesen Sie auch:

ChatGPT ist in einer Enterprise-Version verfügbar

Checkmarx bekämpft die von ChatGPT generierten Schwachstellen

Mehr als 100.000 ChatGPT-Konten kompromittiert

ChatGPT: BEC-Angriffe haben sich in Europa versiebenfacht

Netskope möchte den Einsatz von ChatGPT in der Wirtschaft sichern

ChatGPT und Cyberkriminalität: Erstellen von Malware mithilfe von Konversations-KI

ChatGPT: Zwischen Vor- und Nachteilen sind die Herzen der Lehrer zerrissen

Herzlichen Glückwunsch, Sie haben sich für unseren Newsletter angemeldet!

Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein