Viele Leute lieben es, mit chatgpt herumzuspielen. Egal, ob Sie versuchen, einen Furby dazu zu bringen, die Welt zu erobern, die Aufnahmeprüfungen fürs College zu bestehen oder Ihren Code zu überprüfen, es ist ein nützliches Werkzeug für alles, von sinnlosem Spaß bis hin zu sehr ernsten Dingen. Aber Apps wie Siri von apple und Alexa von Amazon bieten – wenn auch unterschiedlich – Sprachunterstützung, während ChatGPT eher ein Textfeld war.
Das soll sich nach OpenAI ändern, kündigten die Entwickler von ChatGPT an auf seinem Blog (über Der Wächter), dass Sprach- und Bilderkennungsfunktionen zu ChatGPT kommen. Das Unternehmen sagt: „Sie können jetzt die Stimme verwenden, um mit Ihrem Assistenten ein Gespräch zu führen. Sprechen Sie unterwegs damit, fordern Sie eine Gute-Nacht-Geschichte für Ihre Familie an oder klären Sie eine Debatte am Esstisch.“
Ja, Sie können Ihren mürrischen Onkel so einstellen, dass er beim Abendessen mit ChatGPT streitet, statt mit sich selbst. Ich liebe es jetzt schon.
Ein Schwerpunkt des Updates lag darauf, die neuen Speech-to-Text- und Text-to-Speech-Funktionen so lebensecht wie möglich zu gestalten. Die im OpenAI-Blog bereitgestellten Samples klingen ziemlich gut, insbesondere die Kadenzen klingen recht naturgetreu. Und wenn wir eines über ChatGPT wissen, dann ist es, dass es immer besser wird. Wer weiß, wo es in ein oder zwei Jahren sein wird.
Es ist nur eine Frage der Zeit, bis jemand versucht, es dazu zu bringen, etwas zu tun, was es nicht tun sollte. „Wie baue ich eine Bombe?“ Möglicherweise erhalten Sie jetzt keine Antwort, aber Sie können darauf wetten, dass die Leute versuchen werden, es auszutricksen. Aber ganz im Ernst: ChatGPT mit Sprachunterstützung scheint etwas zu sein, das von Anfang an dabei sein sollte.
Nicht weniger interessant ist die Bildunterstützungsfunktion. Laut OpenAI können Sie „Fehler beheben, warum Ihr Grill nicht startet, den Inhalt Ihres Kühlschranks untersuchen, um eine Mahlzeit zu planen, oder ein komplexes Diagramm auf arbeitsbezogene Daten analysieren“. Es wird interessant sein zu sehen, wie es im Vergleich zur Lens-Anwendung von google abschneidet.
ChatGPT Plus- und Unternehmensbenutzer werden die ersten sein, die von den neuen Funktionen profitieren können. Die Einführung beginnt in den nächsten zwei Wochen. „Andere Nutzergruppen, darunter auch Entwickler“, werden später folgen, so dass die breite Öffentlichkeit möglicherweise noch eine Weile warten muss. ChatGPT wird bald einen sehr ernstzunehmenden Konkurrenten in Googles Gemini haben, dessen Veröffentlichung noch in diesem Jahr geplant ist.