NEW YORK (AP) – OpenAI sagt, dass es plant, die Verwendung einer seiner chatgpt-Stimmen einzustellen, nachdem einige Benutzer sagten, dass es so klinge Scarlett Johanssonder im Film von 2013 bekanntermaßen die Stimme eines fiktiven und damals futuristischen KI-Assistenten verkörperte „Ihr.“

In einem Post Auf der Social-Media-Plattform Das Unternehmen sagte, es habe „Fragen gehört“, wie es die lebensechten Audiooptionen auswählt, die für seinen Flaggschiff-Chatbot mit künstlicher Intelligenz, insbesondere Sky, verfügbar sind, und wolle diese beantworten.

OpenAI entlarvte auch schnell die Theorien des Internets über Johansson in einem begleitenden Blogbeitrag, in dem detailliert beschrieben wurde, wie die Stimmen von ChatGPT ausgewählt wurden.

„Wir glauben, dass KI-Stimmen nicht absichtlich die unverwechselbare Stimme einer Berühmtheit nachahmen sollten – Skys Stimme ist keine Nachahmung von Scarlett Johansson, sondern gehört einer anderen professionellen Schauspielerin, die ihre eigene natürliche Sprechstimme verwendet“, so das Unternehmen schrieb. Aus Datenschutzgründen dürfe das Unternehmen die Namen seiner Synchronsprecher nicht weitergeben.

Das in San Francisco ansässige Unternehmen OpenAI äußerte sich nicht weiter dazu, warum es sich dennoch dazu entschloss, die Nutzung von Sky zu pausieren.

OpenAI führte im September erstmals Sprachfunktionen für ChatGPT ein, die fünf verschiedene Stimmen umfassten und es Benutzern ermöglichten, sich mit dem KI-Assistenten gegenseitig zu unterhalten. „Voice Mode“ war ursprünglich nur für zahlende Abonnenten verfügbar, doch im November wurde OpenAI eingeführt angekündigt dass die Funktion für alle Benutzer der mobilen App kostenlos wird.

Und die Interaktionen von ChatGPT werden immer ausgefeilter. Letzte Woche sagte OpenAI das neuestes Update seines generativen KI-Modells kann in seinen verbalen Reaktionen menschliche Rhythmen nachahmen und sogar versuchen, die Stimmungen von Menschen zu erkennen.

Siehe auch  Da ChatGPT immer beliebter wird, erwägt OpenAI einen App Store für die KI-Software VentureBeat The Machine

Laut OpenAI arbeitet das neueste Modell mit dem Namen GPT-4o schneller als frühere Versionen und kann Text, Audio und Video in Echtzeit verarbeiten. In einer Demonstration während der OpenAI-Ankündigung am 13. Mai chattete der KI-Bot in Echtzeit und fügte seiner Stimme wie gewünscht Emotionen – insbesondere „mehr Drama“ – hinzu. Es war auch ein Versuch, den emotionalen Zustand einer Person zu extrapolieren, indem man sich ein Selfie-Video ihres Gesichts ansah, was bei Sprachübersetzungen, Schritt-für-Schritt-Matheaufgaben und mehr hilfreich war.

GPT-4o, die Abkürzung für „Omni“, ist noch nicht allgemein verfügbar. Es wird in den kommenden Wochen und Monaten schrittweise seinen Weg zu ausgewählten Benutzern finden. Die Einführung der Text- und Bildfunktionen des Modells hat bereits begonnen und soll sogar einige derjenigen erreichen, die das kostenlose Kontingent von ChatGPT nutzen – der neue Sprachmodus wird jedoch nur für zahlende Abonnenten von ChatGPT Plus verfügbar sein.

Während die meisten diese neu angekündigten Funktionen noch nicht in die Hände bekommen haben, haben die Funktionen noch mehr Vergleiche mit Spike Jonzes dystopischer Romanze „Her“ hervorgerufen, in der es um einen introvertierten Mann (Joaquin Phoenix) geht, der sich in einen KI-Operator verliebt System (Johansson), was zu vielen Komplikationen führt.

Auch OpenAI-CEO Sam Altman schien dies zu nutzen – ganz einfach Veröffentlichung das Wort „sie“ auf der Social-Media-Plattform X am Tag der Enthüllung von GPT-4o.

Viele, die letzte Woche auf die Demos des Models reagierten, fanden auch, dass einige der Interaktionen einen seltsam koketten Ton annahmen. In Eins Video Gepostet von OpenAI, lobt ein ChatGPT mit weiblicher Stimme beispielsweise einen Mitarbeiter eines Unternehmens dafür, dass er „einen OpenAI-Hoodie rockt“, und in einem anderen Chatbot sagt „Oh, hör auf, du bringst mich zum Erröten“, nachdem man ihm gesagt hatte, dass es erstaunlich sei.

Siehe auch  Das Verbot von ChatGPT wird das Betrügen nicht stoppen

Dies hat einige Diskussionen über die geschlechtsspezifische Art und Weise ausgelöst, die Technologieunternehmen laut Kritikern schon lange bei der Entwicklung und Interaktion mit Sprachassistenten genutzt haben, und zwar schon lange, bevor die jüngste Welle der generativen KI die Fähigkeiten von KI-Chatbots weiterentwickelte. Im Jahr 2019 wurde die Kultur- und Wissenschaftsorganisation der Vereinten Nationen gegründet wies auf „fest verankerte Unterwürfigkeit“ hin eingebaut in standardmäßige Assistenten mit weiblicher Stimme (wie Apples Siri oder Amazons Alexa), selbst wenn sie mit sexistischen Beleidigungen und Belästigungen konfrontiert werden.

„Das ist eindeutig darauf ausgelegt, das Ego der Typen zu stärken“, sagte Desi Lydic, Chefkorrespondentin der Daily Show, letzte Woche in einem Beitrag über GPT-4o. „Man merkt wirklich, dass ein Mann diese Technologie entwickelt hat.“

5/5 - (228 votes)
Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein