OpenAI hat chatgpt und seinen APIs ein neues großes Sprachmodell (LLM) namens GPT-4o mini hinzugefügt. Wie der Name schon sagt, ist das GPT-4o Mini-Modell eine kleinere Version des im Mai eingeführten GPT-4o-Modells. Das Mini-Modell soll die Leistung von GPT-4o mit einem kosteneffizienteren Ansatz ausgleichen.

GPT-4o mini hat viele der Funktionen seines größeren Cousins, obwohl die API derzeit nur Text- und Bildunterstützung bietet und Bild-, Video- und Audioein- und -ausgänge noch in Arbeit sind. Wie GPT-4o hat das neue Modell ein Kontextfenster von 128.000 Token, also achtmal so viel wie GPT-3.5 Turbo. Das neue Modell verfügt außerdem über verbesserte Sicherheitsfunktionen. Zusätzlich zu den bereits in GPT-4o integrierten Funktionen wurden bei GPT-4o mini neue Techniken hinzugefügt, die es widerstandsfähiger gegen Jailbreaks und unsachgemäße Prompt-Injektionen machen, neben anderen Problemen, die Entwickler betreffen, die KI-APIs breit einsetzen möchten.

Bereit für größere Aufgaben

OpenAI schlägt vor, dass das größere Kontextfenster und andere Verbesserungen, wie z. B. ein verbessertes Verständnis von nicht-englischen Texten, GPT-4o mini besonders nützlich für die Verarbeitung großer Dokumente oder die Verknüpfung mehrerer Interaktionen mit dem KI-Modell machen werden. So könnte es beispielsweise bessere Empfehlungen in Online-Shops liefern, Echtzeit-Textantworten für den Kundendienst beschleunigen und Studenten, die für eine Prüfung lernen, schneller genaue und detaillierte Antworten liefern als andere Modelle. OpenAI hat die Vision, dass GPT-4o dank seiner Fähigkeit, Daten abzurufen und Aktionen mit externen Systemen durchzuführen, Geschäftsprozesse automatisiert und rationalisiert. Für Unternehmen, die die API verwenden, werden die Kosten deutlich auf etwas mehr als die Hälfte des Preises pro Token von GPT-3.5 Turbo reduziert.

Siehe auch  WormGPT: Was Sie über die Antwort des Cyberkriminellen auf ChatGPT wissen müssen

„OpenAI hat sich zum Ziel gesetzt, Intelligenz so breit wie möglich zugänglich zu machen“, so OpenAI erklärt in seiner Ankündigung. „Wir erwarten, dass GPT-4o mini die Palette der mit KI erstellten Anwendungen erheblich erweitern wird, indem es Intelligenz viel erschwinglicher macht.“

GPT-4o mini ist Teil der jüngsten Welle kleinerer LLMs wie Googles Gemini Flash und Anthropics Claude Haiku. Laut OpenAI schlägt GPT-4o mini sie jedoch bei vielen Standardtests um Längen. Das Modell erreichte beim Massive Multitask Language Understanding (MMLU)-Benchmark 82 %, verglichen mit 77,9 % bzw. 73,8 % bei Gemini Flash und Haiku. Dasselbe gilt für die MGSM- und Human Eval-Tests, bei denen GPT-4o Mini 87 % bzw. 87,2 % erreichte, während Gemini Flash 75,5 % bzw. 71,5 % und Haiku 71,7 % bzw. 75,9 % erreichte. Mit anderen Worten: GPT-4o Mini gewinnt neben Mathematik- und Programmieraufgaben auch beim Textverständnis, wie in der folgenden Grafik zu sehen ist.

(Bildnachweis: OpenAI)

Mini-Modell Hauptpläne

Die Einführung von GPT-4o Mini stellt laut OpenAI einen bedeutenden Schritt dar, um fortschrittliche KI erschwinglicher und zugänglicher zu machen. Niedrigere Kosten und bessere Leistung werden wahrscheinlich dazu beitragen, KI in alltägliche Anwendungen zu integrieren. Dasselbe gilt für ChatGPT-Benutzer, die ab dieser Woche alle auf das Modell zugreifen können. OpenAI plant außerdem, Feinabstimmungsfunktionen für GPT-4o Mini innerhalb der API einzuführen.

Das Gesamtbild zeigt einen weiteren Schritt in den sich entwickelnden Diensten von ChatGPT. Während OpenAI GPT-3.5 für ChatGPT auslaufen lässt, verlagert sich der Fokus auf die nächste Phase der Bereitstellung leistungsfähigerer Modelle. OpenAI-CEO Sam Altman hat schon lange angedeutet, wie GPT-5 die bestehenden Modelle „wesentlich verbessern“ wird. Gleichzeitig zeigt die durchgesickerte OpenAI-Skala zur Messung der KI-Leistung, dass es noch ein weiter Weg ist bis zur immer noch mythischen künstlichen allgemeinen Intelligenz (AGI), die die Funktionsweise des menschlichen Geistes perfekt nachahmen kann.

Weitere Empfehlungen

Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein