Der chatgpt-Hersteller OpenAI hat ein Tool zum Klonen von Stimmen vorgestellt, hat jedoch noch keine Pläne, es zu veröffentlichen, da er versucht, Sicherheitsbedenken im Zusammenhang mit der neuesten Ergänzung seines Arsenals generativer künstlicher Intelligenz auszuräumen.
Der Dienst Voice Engine befindet sich seit Ende 2022 in der Entwicklung – etwa zur gleichen Zeit, als ChatGPT gestartet wurde – und nutzt Texteingabe und ein 15-sekündiges Audio-Sample, um „natürlich klingende Sprache zu erzeugen, die dem ursprünglichen Sprecher“, Kalifornien, sehr ähnlich ist -basierend OpenAI sagte in einem Blogbeitrag am Freitag.
Ziel sei die Lesehilfe, die Übersetzung, die Unterstützung nonverbaler Menschen und die Unterstützung von Patienten mit degenerativen Sprachstörungen bei der Wiedererlangung ihrer Stimme sowie ein Dienst zur Beschleunigung kommunaler Dienste in entlegenen Gebieten, hieß es.
Voice Engine ergänzt OpenAIs Suite generativer KI-Plattformen, darunter Dall-E für Bilder, Sora für Videos und ChatGPT, mit denen die generative KI-Revolution begann.
Frühe Tester werden in der Lage sein, eine Vorschau von Voice Engine zu testen, ohne dass „zum jetzigen Zeitpunkt“ geplant ist, an die Börse zu gehen, sagte OpenAI, im Einklang mit dem „Ansatz des Unternehmens zur KI-Sicherheit und unserer freiwilligen Verpflichtung“.
„Aufgrund der Möglichkeit des Missbrauchs synthetischer Stimmen gehen wir bei einer umfassenderen Veröffentlichung vorsichtig und informiert vor. Wir hoffen, einen Dialog über den verantwortungsvollen Einsatz synthetischer Stimmen zu beginnen und darüber, wie sich die Gesellschaft an diese neuen Fähigkeiten anpassen kann“, sagte OpenAI.
Das Unternehmen hat keinen Zeitplan für die allgemeine Veröffentlichung von Voice Engine angegeben.
„Basierend auf diesen Gesprächen und den Ergebnissen dieser kleinen Tests werden wir eine fundiertere Entscheidung darüber treffen, ob und wie wir diese Technologie in großem Maßstab einsetzen“, hieß es.
Das Klonen von Stimmen wird seit langem in der Industrie eingesetzt und unterstützt Aufgaben wie Kundenbetreuung und -einbindung sowie einen Beitrag zur Kosten- und Betriebseffizienz.
Der weltweite Markt für das Klonen von Stimmen wird bis 2030 voraussichtlich fast 9,3 Milliarden US-Dollar erreichen, gegenüber geschätzten 1,45 Milliarden US-Dollar im Jahr 2022, und mit einer durchschnittlichen jährlichen Wachstumsrate von mehr als 26 Prozent wachsen. Neueste Daten von Grand View Research zeigen.
Mit dem Aufkommen der generativen KI sind jedoch auch Risiken in den Vordergrund gerückt, zu denen unter anderem Fehlinformationen, Fälschungen und Voreingenommenheit gehören.
Insbesondere OpenAI räumte ein, dass diese Risiken im Jahr 2024 zunehmen, da es sich um ein Wahljahr in den USA handelt, in dem mit einem Rückkampf zwischen dem amtierenden Präsidenten Joe Biden und Donald Trump zu rechnen ist, der sich 2024 einen stark polarisierenden, von den sozialen Medien angeheizten Kampf lieferte 2020.
„Wir sind uns bewusst, dass die Generierung von Sprache, die den Stimmen von Menschen ähnelt, ernsthafte Risiken birgt … Wir arbeiten mit US-amerikanischen und internationalen Partnern aus den Bereichen Regierung, Medien, Unterhaltung, Bildung, Zivilgesellschaft und darüber hinaus zusammen, um sicherzustellen, dass wir ihr Feedback bei unserer Entwicklung berücksichtigen“, sagte OpenAI .
So beeinflussen KI und Deepfakes die Wahlen im Jahr 2024
OpenAI sagte, seine Voice Engine-Partner hätten seinen Nutzungsrichtlinien zugestimmt, die die Nachahmung einer anderen Person oder Organisation ohne Zustimmung oder Rechtsanspruch verbieten und eine „ausdrückliche und informierte Zustimmung“ des ursprünglichen Sprechers erfordern.
„Wir erlauben Entwicklern nicht, Möglichkeiten für einzelne Benutzer zu entwickeln, ihre eigenen Stimmen zu erstellen. Partner müssen ihrem Publikum auch deutlich machen, dass die Stimmen, die sie hören, KI-generiert sind“, sagte das Unternehmen.
100-Milliarden-Dollar-Rechenzentrums-Supercomputer mit Microsoft
Unterdessen führen OpenAI und sein größter Unterstützer Microsoft Gespräche über die Entwicklung eines Rechenzentrums, das von einem Supercomputer angetrieben wird, der aus Millionen spezialisierter Chips besteht. Die Information berichtete am Freitag unter Berufung auf Quellen.
Der Supercomputer mit dem Namen Stargate soll bis zu 100 Milliarden US-Dollar kosten und in den USA stationiert sein, hieß es.
Microsoft, das Berichten zufolge im Januar 2023 10 Milliarden US-Dollar in OpenAI investiert hat, wird höchstwahrscheinlich das Projekt finanzieren, das im Vergleich zu aktuellen Rechenzentrumsprojekten etwa 100-mal teurer wäre, heißt es in dem Bericht.
OpenAI und Microsoft haben den Bericht nicht kommentiert.
Aktualisiert: 30. März 2024, 07:36 Uhr