OpenAI, das Unternehmen hinter dem beliebten Chatbot chatgpt, hat Voice-neben-Bild eingeführt, das es Benutzern nun ermöglicht, über Chats hinauszugehen und Sprachgespräche mit dem KI-Tool zu führen.
Das Unternehmen gab bekannt, dass die neuen Funktionen in den nächsten zwei Wochen für Plus- und Enterprise-Benutzer bereitgestellt werden. Es fügte hinzu, dass dies auch auf iOS und Android verfügbar sein würde und Benutzer dies über ihre App-Einstellungen aktivieren können.
Bei der Ankündigung der Funktionen am Montag erklärte das Unternehmen:
- „Wir beginnen mit der Einführung neuer Sprach- und Bildfunktionen in ChatGPT. Sie bieten eine neue, intuitivere Art von Benutzeroberfläche, indem sie es Ihnen ermöglichen, ein Sprachgespräch zu führen oder ChatGPT zu zeigen, worüber Sie sprechen.
- „Sprache und Bild bieten Ihnen mehr Möglichkeiten, ChatGPT in Ihrem Leben zu nutzen. Machen Sie auf Reisen ein Foto von einem Wahrzeichen und führen Sie ein Live-Gespräch darüber, was daran interessant ist. Wenn Sie zu Hause sind, machen Sie Fotos von Ihrem Kühlschrank und Ihrer Speisekammer, um herauszufinden, was es zum Abendessen gibt (und stellen Sie Folgefragen für ein Schritt-für-Schritt-Rezept). Helfen Sie Ihrem Kind nach dem Abendessen bei einer Matheaufgabe, indem Sie ein Foto machen, die Aufgabenstellung einkreisen und Hinweise mit Ihnen beiden teilen lassen.“
Neue Updates auch für Bard
Die Ankündigung von OpenAI erfolgt kaum eine Woche, nachdem google auch neue Updates für sein Bard AI-Tool veröffentlicht hat. Google sagte, es habe die Fähigkeiten von Bard erweitert, indem es Informationen aus den Google-Apps und -Diensten abgerufen habe, auf die Nutzer täglich zurückgreifen.
- „Bard kann jetzt Echtzeitinformationen aus Karten, YouTube, Hotels und Flügen abrufen und Sie bei der Arbeit damit unterstützen. Sie können das, was Sie benötigen, aus verschiedenen Informationsquellen zusammentragen und Ideen einfacher und schneller zum Leben erwecken. Diese Erweiterungen sind standardmäßig aktiviert und Sie können sie jederzeit deaktivieren.
- „Jetzt können Sie nicht nur mit den Informationen der Welt, sondern auch mit Ihren eigenen zusammenarbeiten, alles an einem Ort, mit Bard als Ihrem kreativen Partner. Mit Ihrer Erlaubnis können Sie Bard ermöglichen, mit Informationen aus Gmail, Docs und Drive zu interagieren, sodass Sie Ihre persönlichen Inhalte finden, zusammenfassen und Fragen beantworten können. „Ihre Google Workspace-Daten werden nicht zum Trainieren des öffentlichen Modells von Bard verwendet und Sie können es jederzeit deaktivieren.“ Google angekündigt.
Laut Google war Bards Fähigkeit, mit anderen Apps und Diensten zu kommunizieren, um hilfreichere Antworten zu geben, der erste Schritt zu einer grundlegend neuen Funktion des KI-Tools.
Die Verbesserungen der KI-Fähigkeiten erfolgen vor dem Hintergrund globaler Bedenken, dass KI zu einer großen Bedrohung für die Menschheit werden könnte.