OpenAI sagt, dass es plant, die Verwendung einer seiner chatgpt-Stimmen einzustellen, nachdem einige Benutzer sagten, sie klinge wie Scarlett Johansson, die im Film von 2013 bekanntermaßen eine fiktive und damals futuristische KI-Assistentin sprach „Ihr.“
In einem Post Auf der Social-Media-Plattform Das Unternehmen sagte, es habe „Fragen gehört“, wie es die lebensechten Audiooptionen auswählt, die für seinen Flaggschiff-Chatbot mit künstlicher Intelligenz, insbesondere Sky, verfügbar sind, und wolle diese beantworten.
OpenAI entlarvte auch schnell die Theorien des Internets über Johansson in einem begleitenden Blogbeitrag, in dem detailliert beschrieben wurde, wie die Stimmen von ChatGPT ausgewählt wurden.
„Wir glauben, dass KI-Stimmen nicht absichtlich die unverwechselbare Stimme einer Berühmtheit nachahmen sollten – Skys Stimme ist keine Nachahmung von Scarlett Johansson, sondern gehört einer anderen professionellen Schauspielerin, die ihre eigene natürliche Sprechstimme verwendet“, so das Unternehmen schrieb. Aus Datenschutzgründen dürfe das Unternehmen die Namen seiner Synchronsprecher nicht weitergeben.
Das in San Francisco ansässige Unternehmen OpenAI äußerte sich nicht näher zu den Gründen, warum es sich dennoch dazu entschieden hat, die Nutzung durch Sky zu unterbrechen.
OpenAI führte im September erstmals Sprachfunktionen für ChatGPT ein, die fünf verschiedene Stimmen umfassten und es Benutzern ermöglichten, sich mit dem KI-Assistenten gegenseitig zu unterhalten. „Voice Mode“ war ursprünglich nur für zahlende Abonnenten verfügbar, doch im November wurde OpenAI eingeführt angekündigt dass die Funktion für alle Benutzer der mobilen App kostenlos wird.
Und die Interaktionen von ChatGPT werden immer ausgefeilter. Letzte Woche sagte OpenAI das neuestes Update seines generativen KI-Modells kann in seinen verbalen Reaktionen menschliche Rhythmen nachahmen und sogar versuchen, die Stimmungen von Menschen zu erkennen.
Laut OpenAI arbeitet das neueste Modell mit dem Namen GPT-4o schneller als frühere Versionen und kann Text, Audio und Video in Echtzeit verarbeiten. In einer Demonstration während der OpenAI-Ankündigung am 13. Mai chattete der KI-Bot in Echtzeit und fügte seiner Stimme wie gewünscht Emotionen – insbesondere „mehr Drama“ – hinzu. Es war auch ein Versuch, den emotionalen Zustand einer Person zu extrapolieren, indem man sich ein Selfie-Video ihres Gesichts ansah, was bei Sprachübersetzungen, Schritt-für-Schritt-Matheaufgaben und mehr hilfreich war.
GPT-4o, die Abkürzung für „Omni“, ist noch nicht allgemein verfügbar. Es wird in den kommenden Wochen und Monaten schrittweise seinen Weg zu ausgewählten Benutzern finden. Die Einführung der Text- und Bildfunktionen des Modells hat bereits begonnen und soll sogar einige derjenigen erreichen, die das kostenlose Kontingent von ChatGPT nutzen – der neue Sprachmodus wird jedoch nur für zahlende Abonnenten von ChatGPT Plus verfügbar sein.
Während die meisten diese neu angekündigten Funktionen noch nicht in die Hände bekommen haben, haben die Funktionen noch mehr Vergleiche mit Spike Jonzes dystopischer Romanze „Her“ hervorgerufen, in der es um einen introvertierten Mann (Joaquin Phoenix) geht, der sich in einen KI-Operator verliebt System (Johansson), was zu vielen Komplikationen führt.
Auch OpenAI-CEO Sam Altman schien dies zu nutzen – ganz einfach Veröffentlichung das Wort „sie“ auf der Social-Media-Plattform X am Tag der Enthüllung von GPT-4o.
Viele, die letzte Woche auf die Demos des Models reagierten, fanden auch, dass einige der Interaktionen einen seltsam koketten Ton annahmen. In Eins Video Gepostet von OpenAI, lobt ein ChatGPT mit weiblicher Stimme beispielsweise einen Mitarbeiter eines Unternehmens dafür, dass er „einen OpenAI-Hoodie rockt“, und in einem anderen Chatbot sagt „Oh, hör auf, du bringst mich zum Erröten“, nachdem man ihm gesagt hatte, dass es erstaunlich sei.
Dies hat einige Diskussionen über die geschlechtsspezifische Art und Weise ausgelöst, die Technologieunternehmen laut Kritikern schon lange bei der Entwicklung und Interaktion mit Sprachassistenten genutzt haben, und zwar schon lange, bevor die jüngste Welle der generativen KI die Fähigkeiten von KI-Chatbots weiterentwickelte. Im Jahr 2019 wurde die Kultur- und Wissenschaftsorganisation der Vereinten Nationen gegründet wies auf „fest verdrahtete Unterwürfigkeit“ hin eingebaut in standardmäßige Assistenten mit weiblicher Stimme (wie Apples Siri oder Amazons Alexa), selbst wenn sie mit sexistischen Beleidigungen und Belästigungen konfrontiert werden.
„Das ist eindeutig darauf programmiert, die Egos der Typen zu nähren“, sagte Desi Lydic, Chefkorrespondent der Daily Show, letzte Woche in einem Segment über GPT-4o. „Man kann wirklich erkennen, dass ein Mann diese Technologie entwickelt hat.“