OpenAI fügt seiner Konversations-KI weiterhin neue Fähigkeiten hinzu, die die Menschheit in eine neue Ära echter Mensch-Maschine-Zusammenarbeit geführt haben. Anbindung an das Web, Analyse und Generierung von Bildern, Analyse und Sprachsynthese stehen dem Chatbot nun auch in der kostenpflichtigen Version zur Verfügung.
chatgpt-can-now-see-hear-and-speak“>ChatGPT wird seit Anfang des Jahres durch das LLM-Modell „GPT-4“ vorangetrieben, von dem wir wissen, dass es multimodal ist, dessen visuelle und akustische Fähigkeiten jedoch bisher eingeschränkt und blockiert waren.
In den letzten Tagen hat OpenAI beschlossen, das Potenzial seiner generativen und konversationalen KI noch etwas auszuschöpfen. Auch wenn diese neuen Funktionen derzeit auf zahlende Nutzer der Versionen ChatGPT Plus und ChatGPT Enterprise beschränkt sind. Zur Erinnerung: Für diejenigen, die kostenlos bleiben möchten, bietet der Bing Chat von Microsoft die meisten dieser Funktionen.
Die Rückkehr der WEB-Verbindung
Es begann mit der Wiedereinsetzung einer Funktion, die diesen Sommer kurzzeitig auftauchte, aber schnell entfernt wurde (nachdem kluge Köpfe herausgefunden hatten, dass sie damit über ChatGPT kostenlos auf kostenpflichtige Websites zugreifen konnten): die Konnektivität der KI im WEB! Das GPT-4-Modell, das ChatGPT zugrunde liegt, wurde mit Dokumenten von vor Ende 2021 trainiert. Ohne Internetverbindung könnte die KI Webdokumente nicht nur nicht wirklich analysieren, sondern auch ihre Antworten nicht mit aktuellen Informationen anreichern. Durch die Aktivierung der Einstellung „Mit Bing durchsuchen“ in „Einstellungen und Beta / Beta-Funktionen“ kann die Konversations-KI nun Fragen zu aktuellen Themen und Ereignissen beantworten und eine Verbindung zum Web herstellen, um ihre Analysen zu verfeinern.
Vom Verstehen bis zur Bildergenerierung
Eine weitere wichtige Neuerung: OpenAI hat sich endlich entschieden, das multimodale Potenzial von GPT-4 freizusetzen. ChatGPT basiert ab sofort auf der brandneuen GPT-4V-Iteration seines Basismodells und formalisiert damit den Zugang zur Bildanalyse. Benutzer von ChatGPT Plus können bald (und können dies jetzt auch auf den iOS- und Android-Mobilversionen) Bilder oder mit Bildern illustrierte Fragen einreichen und diese von der KI analysieren und kommentieren lassen. KI kann so handgeschriebene Manuskripte übersetzen, die gezeichnete Kontur eines Algorithmus oder eines Bildschirms in Computercode umwandeln, ein Foto oder Gemälde analysieren und beschreiben, Captchas analysieren und vieles mehr. Darüber hinaus wird OpenAI in Kürze auch seinen spektakulären Bildgenerator „Dall-E 3“ in ChatGPT integrieren (er ist bereits verfügbar auf Bing Image Creator und die Renderings sind wirklich viel beeindruckender als bei Dall-E 2) und konkurrieren ernsthaft mit midjourney, bieten aber mehr Stilvielfalt.
Stimme, um Interaktionen zu erweitern
Eine der großen Stärken der generativen KI besteht darin, dass sie die Mensch-Maschine-Interaktionen revolutioniert, indem sie natürliche Sprache zur Unterstützung dieser Interaktionen macht. Von nun an besteht die Idee darin, solche Interaktionen mit der Stimme statt mit dem Schreiben durchführen zu können. Aufgrund der aktuellen Zeit der Analyse und des Verständnisses der menschlichen Sprache müssen wir noch ein wenig warten, um eine Diskussion wie mit einem Menschen zu führen. Aber wir kommen näher. Mit Bing Chat in der mobilen Version können Sie Fragen per Spracheingabe stellen und die KI kann diese auch per Spracheingabe beantworten. Dabei greift die KI auf von Microsoft entwickelte Modelle zurück. OpenAI wird in Kürze sein Voice-to-Text-Modell „Whisper“ in ChatGPT Plus integrieren. Dank eines neuen „TTS – Text to Speech“-Modells mit 5 verschiedenen Stimmen kann der Chatbot auch sprechen.
Mit anderen Worten: ChatGPT kann jetzt eine Verbindung herstellen, sehen, sprechen und hören. So viele neue Funktionen, die clevere kleine Benutzer unbedingt für unvorhergesehene Zwecke nutzen werden, indem sie Spaß daran haben, die Einschränkungen zu umgehen, die OpenAI eingeführt hat, um böswillige oder unangemessene Nutzungen ihrer KI zu verhindern.
Lesen Sie auch:
ChatGPT ist in einer Enterprise-Version verfügbar
Checkmarx bekämpft die von ChatGPT generierten Schwachstellen
Mehr als 100.000 ChatGPT-Konten kompromittiert
ChatGPT: BEC-Angriffe haben sich in Europa versiebenfacht
Netskope möchte den Einsatz von ChatGPT in der Wirtschaft sichern
ChatGPT und Cyberkriminalität: Erstellen von Malware mithilfe von Konversations-KI
ChatGPT: Zwischen Vor- und Nachteilen sind die Herzen der Lehrer zerrissen
Herzlichen Glückwunsch, Sie haben sich für unseren Newsletter angemeldet!