Das in Frankreich ansässige Startup Mistral AI hat einem immer dichter werdenden KI-Markt ein neues proprietäres Large Language Model (LLM) hinzugefügt und behauptet, sein neues Mistral Large könne mehreren großen Konkurrenten Konkurrenz machen.
In einem Beitrag vom 26. Februar stellte das in Paris ansässige Unternehmen fest, dass Mistral Large mehrere bemerkenswerte LLMs mit Ausnahme von GPT-4 in einem „Multitask-Sprachverständnis“-Test übertraf und in mehreren Mathematik- und Codierungstests gut abgeschnitten habe.
Allerdings wurde die Leistung von Mistral Large nicht mit denen von xAIs Grok und Googles Gemini Ultra verglichen, die letzten November bzw. Anfang Februar veröffentlicht wurden.
Guillaume Lample, Gründer und Chefwissenschaftler des Unternehmens, behauptet, Mistral Large sei den früheren Modellen von Mistral AI „weit überlegen“. Mistral AI führte außerdem „Le Chat“ ein – eine KI-Chat-Schnittstelle zusätzlich zu seinen Modellen – ähnlich wie chatgpt auf GPT-3.5 und GPT-4 aufbaut.
Heute bringen wir Mistral Large auf den Markt, unser neuestes Modell. Mistral Large ist Mistral Medium weit überlegen, verarbeitet 32.000 Kontext-Tokens und spricht fließend Englisch, Französisch, Spanisch, Deutsch und Italienisch.
Wir haben Mistral Small auch auf unserer API auf ein Modell aktualisiert, das … pic.twitter.com/MO4m6UIJUV ist
Das Unternehmen, das im Dezember 487 Millionen US-Dollar von Unternehmen wie Nvidia, Salesforce und Andreessen Horowitz erhielt, stellte fest, dass Mistral Large mehr als 20.000 Wörter auf Englisch beherrscht und außerdem fließend Französisch, Spanisch, Deutsch und Italienisch spricht.
Während das erste Modell von Mistral AI unter einer Open-Source-Lizenz veröffentlicht wurde, ist Mistral Large ein geschlossenes, proprietäres Modell, ähnlich den neuesten von OpenAI veröffentlichten LLMs, was bei einigen X-Beobachtern zu Enttäuschung führte.
Während KI-Chatbot-Ranking-Plattformen von Drittanbietern wie Chatbot Arena Mistral Large nicht bewertet haben, belegt sein früheres Modell Mistral Medium den sechsten Platz in einer Liste von über 60 LLMs.
Die Tausenden von paarweisen Bewertungen von Chatbot Arena werden durch ein Bradley-Terry-Modell verarbeitet, das mithilfe von Zufallsstichproben eine „Elo“-Bewertung erstellt und abschätzt, welches Modell im direkten Wettbewerb gegen ein anderes Modell am wahrscheinlichsten gewinnen wird.
Das Unternehmen gab außerdem kürzlich seine Partnerschaft mit Microsoft bekannt, die Mistral Large auf Azure AI Studio und Azure Machine Learning zugänglich machen wird.
Wir kündigen eine mehrjährige Partnerschaft mit @MistralAI an, da wir auf unserem Engagement aufbauen, Kunden die beste Auswahl an offenen und Basismodellen auf Azure anzubieten. https://t.co/k1L7lfFeES
„Das Vertrauen von Microsoft in unser Modell ist ein Schritt vorwärts auf unserem Weg“, sagte Mistral AI über sein kommerziell ausgerichtetes LLM.
Mistral Large wird die „Supercomputing-Infrastruktur“ von Azure zu Schulungs- und Skalierungszwecken nutzen, während die beiden Unternehmen auch bei der KI-Forschung und -Entwicklung zusammenarbeiten werden, heißt es in einer Erklärung von Eric Boyd, Corporate Vice President der Azure AI Platform von Microsoft, vom 26. Februar.