das Essenzielle Moshi wurde innerhalb von sechs Monaten von Forschern des französischen Unternehmens Kyutai entwickelt und ist eine neue künstliche Intelligenz, die schnell mit Branchenriesen wie OpenAI und chatgpt konkurrieren könnte

In der Welt der künstlichen Intelligenz geht alles sehr schnell. Während die Menschen gerade erst anfangen, sie in ihren Alltag zu integrieren und zu verstehen, hat das französische Unternehmen ein neues Projekt vorgestellt Kyutai.

Das 2023 gegründete und von Xavier Niel, Rodolphe Saadé (CMA-CGM) und Eric Schmidt (ex-google) unterstützte KI-Forschungslabor stellte am Mittwoch, dem 3. Juli, im Rahmen einer Konferenz tatsächlich sein neues technologisches Baby vor. Bei dem betreffenden Projekt handelt es sich um eine Sprachassistenz namens Moshi (Anmerkung des Herausgebers: „moshi moshi“ bedeutet auf Japanisch „Hallo“) und es wäre schneller als das riesige ChatGPT. Wie funktioniert es in der Praxis, programmiert von einem Team französischer Ingenieure?

Mit Mochi können Sie fast wie mit einem Menschen kommunizieren. Tatsächlich ist die Stimme hinter Moshi die einer Künstlerin: Alice. Letzterer hat für das Projekt nicht weniger als 20 Stunden Audio aufgenommen, darunter Monologe mit unterschiedlichen Emotionen, Drehbuchgespräche und improvisierte Dialoge. Sein Stimmklang hebt sich daher deutlich von der Roboterstimme ab, die bereits im Einsatz befindliche „traditionelle“ Sprachassistenzsysteme wie beispielsweise Siri des Riesen apple bieten.

Gestern haben wir Moshi vorgestellt, die Konversations-KI mit der geringsten Latenz, die jemals veröffentlicht wurde. Moshi kann Smalltalk führen, verschiedene Konzepte erklären und Rollenspiele mit vielen Emotionen und Sprechstilen durchführen. Sprechen Sie hier mit Moshi https://t.co/a4EbAQiih7 und erfahren Sie unten mehr über die Methode \ud83e\uddf5. pic.twitter.com/NkJRybTRLQ

– kyutai (@kyutai_labs) 4. Juli 2024

Noch im Prototypenstadium

Auch Moshis Reaktionszeit ist erbaulich: 160 Millisekunden. Diese blitzschnelle Reaktionsfähigkeit ermöglicht äußerst reibungslose Gespräche. Darüber hinaus kann die Stimme des Sprachassistenten 70 verschiedene Töne annehmen. Sie kann flüstern, Witze machen und sogar mit Akzent sprechen.

Siehe auch  So ändern Sie Ihr Passwort in ChatGPT

Diese Leistungen seien umso beeindruckender, als sich Moshi noch im Stadium des „experimentellen Prototyps“ befinde, erklärt Patrick Pérez, Direktor des Kyutai-Labors. Die Sprachunterstützung funktioniert beispielsweise noch nicht auf einem Smartphone oder einem Lautsprecher. Allerdings wird bald ein Internet-Link für die breite Öffentlichkeit zum Testen zur Verfügung gestellt. Dies wird eine Art Feuertaufe für Moshi sein, das mit den Giganten der Branche konkurrieren will und insbesondere OpenAI im Visier hat.

Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein