chatgpt konkurrieren könnte
Moshi wurde innerhalb von sechs Monaten von Forschern des französischen Unternehmens Kyutai entwickelt und ist eine neue künstliche Intelligenz, die schnell mit Branchenriesen wie OpenAI undIn der Welt der künstlichen Intelligenz geht alles sehr schnell. Während die Menschen gerade erst anfangen, sie in ihren Alltag zu integrieren und zu verstehen, hat das französische Unternehmen ein neues Projekt vorgestellt Kyutai.
Das 2023 gegründete und von Xavier Niel, Rodolphe Saadé (CMA-CGM) und Eric Schmidt (ex-google) unterstützte KI-Forschungslabor stellte am Mittwoch, dem 3. Juli, im Rahmen einer Konferenz tatsächlich sein neues technologisches Baby vor. Bei dem betreffenden Projekt handelt es sich um eine Sprachassistenz namens Moshi (Anmerkung des Herausgebers: „moshi moshi“ bedeutet auf Japanisch „Hallo“) und es wäre schneller als das riesige ChatGPT. Wie funktioniert es in der Praxis, programmiert von einem Team französischer Ingenieure?
Mit Mochi können Sie fast wie mit einem Menschen kommunizieren. Tatsächlich ist die Stimme hinter Moshi die einer Künstlerin: Alice. Letzterer hat für das Projekt nicht weniger als 20 Stunden Audio aufgenommen, darunter Monologe mit unterschiedlichen Emotionen, Drehbuchgespräche und improvisierte Dialoge. Sein Stimmklang hebt sich daher deutlich von der Roboterstimme ab, die bereits im Einsatz befindliche „traditionelle“ Sprachassistenzsysteme wie beispielsweise Siri des Riesen apple bieten.
Gestern haben wir Moshi vorgestellt, die Konversations-KI mit der geringsten Latenz, die jemals veröffentlicht wurde. Moshi kann Smalltalk führen, verschiedene Konzepte erklären und Rollenspiele mit vielen Emotionen und Sprechstilen durchführen. Sprechen Sie hier mit Moshi https://t.co/a4EbAQiih7 und erfahren Sie unten mehr über die Methode \ud83e\uddf5. pic.twitter.com/NkJRybTRLQ
– kyutai (@kyutai_labs) 4. Juli 2024
Noch im Prototypenstadium
Auch Moshis Reaktionszeit ist erbaulich: 160 Millisekunden. Diese blitzschnelle Reaktionsfähigkeit ermöglicht äußerst reibungslose Gespräche. Darüber hinaus kann die Stimme des Sprachassistenten 70 verschiedene Töne annehmen. Sie kann flüstern, Witze machen und sogar mit Akzent sprechen.
Diese Leistungen seien umso beeindruckender, als sich Moshi noch im Stadium des „experimentellen Prototyps“ befinde, erklärt Patrick Pérez, Direktor des Kyutai-Labors. Die Sprachunterstützung funktioniert beispielsweise noch nicht auf einem Smartphone oder einem Lautsprecher. Allerdings wird bald ein Internet-Link für die breite Öffentlichkeit zum Testen zur Verfügung gestellt. Dies wird eine Art Feuertaufe für Moshi sein, das mit den Giganten der Branche konkurrieren will und insbesondere OpenAI im Visier hat.