Neuer wichtiger Meilenstein in der kurzen Geschichte von Mistral AI. Das vielversprechende französische Startup, das im Juni von drei Forschern bei google und Meta gegründet wurde, stellte am Mittwoch sein erstes generatives Programm für künstliche Intelligenz vor, das frei wiederverwendbar ist und trotz seiner reduzierten Größe mit bestimmten amerikanischen Konkurrenten konkurrieren soll. „Es ist ein erster Schritt, wir sind dabei, größere Modelle zu entwickeln und eine Plattform zu entwickeln, um ihre Nutzung zu vereinfachen.“ausführlich unterAFP Arthur Mensch, Mitbegründer des Unternehmens mit Sitz in Paris, das mittlerweile 18 Mitarbeiter, darunter 15 Ingenieure, beschäftigt.
Mit 7 Milliarden Parametern wird Mistral 7B leistungsfähiger sein als ein ähnliches Meta-Modell, das doppelt so viele hat, sagt sein Entwickler. Von GPT-3, dem Tool hinter chatgpt, das 175 Milliarden hatte, ist es jedoch noch weit entfernt. „Es handelt sich nicht um eine Anwendung, sondern um den Grundbaustein, den ein Entwickler zum Erstellen seiner Anwendung verwendet.“, warnt Arthur Mensch. Das Modell kann somit zum Vervollständigen von Texten, zum Zusammenfassen von Dokumenten oder zum Beantworten bestimmter Fragen in „Chat“-Form genutzt werden, sofern Sie das Modell selbst auf einer IT-Infrastruktur hosten.
Keine Details zum für das Training verwendeten Datensatz
Mistral AI ist eines der wenigen europäischen Unternehmen, das sich vorgenommen hat, die amerikanischen Giganten Meta, Google oder OpenAI (unterstützt von Microsoft) im Rennen um generative künstliche Intelligenz zu verfolgen, für die neben speziellen Fähigkeiten auch erhebliche Rechenleistung erforderlich ist KI trainieren. Das junge Unternehmen hat im Sommer fast 100 Millionen Euro von zahlreichen Investoren eingesammelt, darunter vom Eigentümer der Iliad-Gruppe Xavier Niel (der am Dienstag bekannt gab, dass er einen Supercomputer für KI gekauft hat).
Arthur Mensch macht keine Angaben zum Datenbestand, der für die Ausbildung verwendet wird, um seinen Wettbewerbsvorteil zu schützen, aber auch, weil die Nutzung dieser aus dem offenen Internet gewonnenen Daten zahlreiche Fragen im Hinblick auf geistiges Eigentum aufwirft. Wir haben gerade erfahren, dass das Modell «parle» vor allem Englisch, und dass die „Reinigung“ dieser Daten basieren nicht auf menschlichen Klickarbeitern, wie dies insbesondere bei OpenAI der Fall war, dem kalifornischen Startup hinter ChatGPT. Polyglot-Modelle befinden sich in der Entwicklung und das Startup will erste Einnahmen dank einer derzeit getesteten Plattform erzielen, die es Unternehmen ermöglicht, kostenlose oder proprietäre Modelle zu hosten und zu verbessern.