OpenAI ist wie andere an synthetischen Stimmen interessiert, damit eine KI die Stimme einer Person nachahmen kann. Die Gruppe um Sam Altman behauptet, einen Weg gefunden zu haben, in nur 15 Sekunden einen Stimmklon eines Menschen zu erstellen.
Werden wir chatgpt in naher Zukunft die Stimme unseres besten Freundes, eines Elternteils oder, warum nicht, unserer eigenen Stimme geben können? Das Ende 2022 von OpenAI erstellte Sprachmodell, schlicht „Voice Engine“ genannt, scheint immer effektiver zu sein. Giganten wie apple können in 15 Minuten eine Stimme erzeugen, OpenAI sagt, dass es das in 15 Sekunden schafft. Er müsste lediglich so lange einer Person zuhören, um eine synthetische Stimme zu erzeugen, die sogar Emotionen nachahmen kann.
Über die Leistung hinaus ein Interesse an Barrierefreiheit
Es ist in einem Blogbeitrag vom 29. März dass OpenAI seine Sprach-Engine detailliert beschreibt. Das Unternehmen, das sich selbst als „vorsichtig“ bezeichnet, stellt sich mehrere Einsatzmöglichkeiten für sein revolutionäres Modell vor. Darunter :
- Unterstützung beim Lesen, damit Menschen sich mit einer vertrauten Stimme konzentrieren können.
- Echtzeitübersetzung, damit Sie eine andere Sprache mit Ihrer eigenen Stimme lernen oder sprechen können.
- Barrierefreiheit, Zielgruppe sind Menschen, die nicht oder nicht mehr sprechen können.
Die wenigen von OpenAI veröffentlichten Auszüge sind beeindruckend, da wir keine Unterschiede zwischen dem Originalauszug und der generierten Stimme erkennen können. Voice Engine ist bereits das Modell, das ChatGPT Voice sowie übersetzte Podcasts in Spotify unterstützt.
Sie können keine Berühmtheit klonen
„Wir sind uns bewusst, dass die Produktion von Reden, die wie die Stimmen der Menschen klingen, ernsthafte Risiken birgt, die in diesem Wahljahr besonders groß sind. » sagte OpenAI am Ende der Pressemitteilung, um seine Absichten zu bestätigen. Um Missbrauch zu vermeiden, ist Voice Engine nicht für die breite Öffentlichkeit zugänglich und die Unternehmen, die es nutzen, verpflichten sich, die Identität anderer nicht an sich zu reißen.
Um negative Verwendungen zu vermeiden, hat OpenAI seiner Technologie ein Audio-Wasserzeichen hinzugefügt, das eine Maschine erkennen kann. „Wir glauben, dass jeder groß angelegte Einsatz der synthetischen Sprachtechnologie von Sprachauthentifizierungsexperimenten begleitet werden sollte, um zu überprüfen, ob der ursprüngliche Sprecher wissentlich seine Stimme zum Dienst hinzufügt, und von einer Liste verbotener Stimmen, um die Erkennung und Verhinderung der Erzeugung zu ähnlicher Stimmen zu ermöglichen.“ zu Persönlichkeiten » fügt das Unternehmen hinzu.
Möchten Sie alles über die Mobilität von morgen wissen, vom Elektroauto bis zum E-Bike? Abonnieren Sie jetzt unseren Watt Else-Newsletter!