Ein vom Milliardär Xavier Niel unterstütztes französisches Forschungslabor für künstliche Intelligenz stellte einen neuen Sprachassistenten mit einer Vielzahl menschenähnlicher Emotionen vor, der einem von OpenAI versprochenen, aber aus Sicherheitsbedenken verzögerten Produkt ähnelt.

Kyutai, eine im letzten Jahr gegründete gemeinnützige KI-Gruppe, stellte am Mittwoch bei einer Veranstaltung in Paris ihren Moshi-Dienst vor. Die Wissenschaftler des Labors sagten, ihr System könne mit 70 verschiedenen Emotionen und Stilen sprechen. Sie führten den Assistenten vor, der Ratschläge zur Besteigung des Mount Everest gab und ein Gedicht rezitierte, das er mit starkem französischen Akzent verfasst hatte.

„Es denkt, während es spricht“, sagte Patrick Pérez, CEO von Kyutai. „Wir glauben, dass Moshi ein enormes Potenzial hat, die Art und Weise zu verändern, wie wir mit und durch Maschinen kommunizieren.“

Der Assistent ist der neueste Herausforderer von OpenAIs chatgpt, dem bekanntesten Chatbot. Eine wachsende Zahl von Startups und Big Tech-Unternehmen, darunter Anthropic, Cohere und google von Alphabet Inc., haben sich beeilt, Modelle einzuführen, die mit OpenAIs GPT-4 konkurrieren können, obwohl einige Branchenexperten sich Sorgen um die Gefahren präsentiert durch die aufkommende Technologie.

OpenAI veranstaltete im Mai eine Auftaktveranstaltung für einen Sprachassistenten für ChatGPT Plus-Benutzer, der erstmals leistungsstarke Bilderkennungsfunktionen mit blitzschnellen Antworten kombinierte. Das neue Produkt sollte innerhalb weniger Wochen verfügbar sein, aber das Unternehmen verzögert Die Einführung soll bis zum Herbst erfolgen und es wurde erklärt, dass die vorgeführten Video- und Bildschirmfreigabefunktionen zunächst nicht enthalten sein werden.

OpenAI wurde auch kritisiert, weil es in seinem Feature eine KI-Stimme präsentierte, die wie die Schauspielerin Scarlett Johansson klang. Das Unternehmen zog die Stimme zurück, nachdem die Schauspielerin angestellte Rechtsanwälte.

Siehe auch  Im Internet erschien eine Liste mit Bewertungen von über 250 Plugins für ChatGPT-4 – ChatGPT auf vc.ru

Pérez sagte, sein Labor werde die Modelle und die Forschung hinter dem Assistenten als Open-Source-Technologie veröffentlichen, wobei der Code frei geteilt werden kann. Er nannte Moshi den „ersten veröffentlichten Echtzeit-Sprach-KI-Assistenten“.

Der neue Dienst sei ein „experimenteller Prototyp“, sagte Kyutai am Mittwoch in einer Erklärung. Ein Vertreter des Labors sagte, das Modell und die Forschung würden in den kommenden Wochen verfügbar sein, ohne jedoch ein Datum zu nennen.

Kyutai war im November gestartet mit 300 Millionen Euro (324 Millionen Dollar) an Fördermitteln, unter anderem von Niel, dem französischen Milliardär Rodolphe Saadé und dem ehemaligen Google-Vorsitzenden Eric Schmidt. Pérez, ein ehemaliger Direktor von Valeo SA, stellte für sein Labor Forscher von Google DeepMind und Meta Platforms Inc. ein.

Der Sprachassistent sei ein vielversprechender Indikator dafür, dass Europa ein globaler Akteur in der KI-Entwicklung sein könne, so Niel. „Alle Produkte, die sie heute gezeigt haben, sind die besten ihrer Klasse weltweit“, sagte er am Mittwoch in einem Interview. „Wir sind sehr froh, das in Europa zu haben.“

Kyutais wissenschaftlicher Leiter Hervé Jégou ging bei der Veranstaltung kurz auf Sicherheitsbedenken ein. Das Labor werde Indexierungs- und Wasserzeichen-Tools verwenden, um von seiner KI generiertes Audio zu identifizieren und zu verfolgen, sagte er.

Um sein neues Modell auszubilden, arbeitete Kyutai nach eigenen Angaben mit einer Synchronsprecherin namens Alice zusammen, ohne jedoch ihren vollen Namen preiszugeben.

Abonnieren Sie den Newsletter „Fortune Next to Lead“, um wöchentlich Strategien zu erhalten, wie Sie es ins Chefbüro schaffen. Kostenlos anmelden.
Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein