NEW YORK (AP) – OpenAI gab am Montag bekannt, dass es plant, die Verwendung einer seiner chatgpt-Stimmen einzustellen, von der „ihre“ Schauspielerin Scarlett Johansson sagt, dass sie „unheimlich ähnlich“ zu ihrer eigenen klingt.
In einem Post Auf der Social-Media-Plattform Das Unternehmen sagte, es habe „Fragen gehört“, wie es die lebensechten Audiooptionen auswählt, die für seinen Flaggschiff-Chatbot mit künstlicher Intelligenz, insbesondere Sky, verfügbar sind, und wolle diese beantworten.
Unter denjenigen, die Fragen aufwarfen, war Johansson, der im Film von 2013 bekanntermaßen die Stimme eines fiktiven und damals futuristischen KI-Assistenten verkörperte „Ihr.“
Johansson gab eine Erklärung heraus, in der es hieß, dass der CEO von OpenAI, Sam Altman, im September an sie herangetreten sei und sie gefragt habe, ob sie dem System ihre Stimme leihen würde. Er meinte, es sei „tröstend für Menschen“, die mit der Technologie nicht vertraut seien. Sie sagte, sie habe das Angebot abgelehnt.
„Als ich die veröffentlichte Demo hörte, war ich schockiert, verärgert und ungläubig, dass Herr Altman eine Stimme verfolgen würde, die meiner so unheimlich ähnlich klang, dass meine engsten Freunde und Nachrichtenagenturen den Unterschied nicht erkennen konnten“, sagte Johansson.
Sie sagte, OpenAI habe „widerstrebend“ zugestimmt, die Sky-Stimme zu entfernen, nachdem sie Anwälte engagiert hatte, die Altman-Briefe schrieben und nach dem Prozess fragten, durch den das Unternehmen auf die Stimme gekommen sei.
OpenAI hatte versucht, die Theorien des Internets über Johansson in einem Blogbeitrag zu entlarven, der seine frühere Ankündigung begleitete und darin detailliert darlegte, wie die Stimmen von ChatGPT ausgewählt wurden. Das Unternehmen schrieb dass es der Meinung sei, dass KI-Stimmen „nicht absichtlich die unverwechselbare Stimme einer Berühmtheit nachahmen sollten“ und dass die Stimme von Sky einer „anderen professionellen Schauspielerin“ gehöre. Es fügte jedoch hinzu, dass der Name dieses Fachmanns aus Datenschutzgründen nicht weitergegeben werden dürfe.
In einer Erklärung, die nach Johanssons Antwort am späten Montag an The Associated Press gesendet wurde, sagte Altman, dass OpenAI den Synchronsprecher hinter Sky „bevor Johansson kontaktiert wurde“.
„Die Stimme von Sky ist nicht die von Scarlett Johansson und es war nie beabsichtigt, dass sie ihrer ähnelt“, sagte Altman. „Aus Respekt vor Frau Johansson haben wir die Verwendung der Stimme von Sky in unseren Produkten eingestellt. Es tut uns leid, Frau Johansson, dass wir nicht besser kommuniziert haben.“
Das in San Francisco ansässige Unternehmen OpenAI führte im September erstmals Sprachfunktionen für ChatGPT ein, die fünf verschiedene Stimmen umfassten und es Benutzern ermöglichten, sich mit dem KI-Assistenten gegenseitig zu unterhalten. „Voice Mode“ war ursprünglich nur für zahlende Abonnenten verfügbar, doch im November wurde OpenAI eingeführt angekündigt dass die Funktion für alle Benutzer der mobilen App kostenlos wird.
Und die Interaktionen von ChatGPT werden immer ausgefeilter. Letzte Woche sagte OpenAI, die neuestes Update seines generativen KI-Modells kann in seinen verbalen Reaktionen menschliche Rhythmen nachahmen und sogar versuchen, die Stimmungen von Menschen zu erkennen.
Laut OpenAI arbeitet das neueste Modell mit dem Namen GPT-4o schneller als frühere Versionen und kann Text, Audio und Video in Echtzeit verarbeiten. In einer Demonstration während der OpenAI-Ankündigung am 13. Mai chattete der KI-Bot in Echtzeit und fügte seiner Stimme wie gewünscht Emotionen – insbesondere „mehr Drama“ – hinzu. Es war auch ein Versuch, den emotionalen Zustand einer Person zu extrapolieren, indem man sich ein Selfie-Video ihres Gesichts ansah, was bei Sprachübersetzungen, Schritt-für-Schritt-Matheaufgaben und mehr hilfreich war.
GPT-4o, die Abkürzung für „Omni“, ist noch nicht allgemein verfügbar. Es wird in den kommenden Wochen und Monaten schrittweise seinen Weg zu ausgewählten Benutzern finden. Die Einführung der Text- und Bildfunktionen des Modells hat bereits begonnen und soll sogar einige derjenigen erreichen, die das kostenlose Kontingent von ChatGPT nutzen – der neue Sprachmodus wird jedoch nur für zahlende Abonnenten von ChatGPT Plus verfügbar sein.
Während die meisten diese neu angekündigten Funktionen noch nicht in die Hände bekommen haben, haben die Funktionen noch mehr Vergleiche mit Spike Jonzes dystopischer Romanze „Her“ hervorgerufen, in der es um einen introvertierten Mann (Joaquin Phoenix) geht, der sich in einen KI-Operator verliebt System (Johansson), was zu vielen Komplikationen führt.
Auch Altman schien dies zu nutzen – ganz einfach Veröffentlichung das Wort „sie“ auf der Social-Media-Plattform X am Tag der Enthüllung von GPT-4o.
Viele, die letzte Woche auf die Demos des Models reagierten, fanden auch, dass einige der Interaktionen einen seltsam koketten Ton annahmen. In Eins Video Gepostet von OpenAI, lobt ein ChatGPT mit weiblicher Stimme beispielsweise einen Mitarbeiter eines Unternehmens dafür, dass er „einen OpenAI-Hoodie rockt“, und in einem anderen Chatbot sagt „Oh, hör auf, du bringst mich zum Erröten“, nachdem man ihm gesagt hatte, dass es erstaunlich sei.
Das hat einige Diskussionen über die geschlechtsspezifische Art und Weise entfacht, die Kritiker sagen, dass Technologieunternehmen schon seit langem Sprachassistenten entwickeln und einsetzen – lange bevor die jüngste Welle generativer KI die Fähigkeiten von KI-Chatbots weiterentwickelte. Im Jahr 2019 wurde die Kultur- und Wissenschaftsorganisation der Vereinten Nationen gegründet wies auf „fest verankerte Unterwürfigkeit“ hin eingebaut in standardmäßige Assistenten mit weiblicher Stimme (wie Apples Siri oder Amazons Alexa), selbst wenn sie mit sexistischen Beleidigungen und Belästigungen konfrontiert werden.
„Das ist eindeutig darauf programmiert, die Egos der Typen zu nähren“, sagte Desi Lydic, Chefkorrespondent der Daily Show, letzte Woche in einem Segment über GPT-4o. „Man kann wirklich erkennen, dass ein Mann diese Technologie entwickelt hat.“
Copyright 2024 The Associated Press. Alle Rechte vorbehalten. Dieses Material darf ohne Genehmigung nicht veröffentlicht, ausgestrahlt, umgeschrieben oder weitergegeben werden.