OpenAI kündigte an die Veröffentlichung seines neuesten generativen Modells im Snackformat, genannt GPT-4o mini, das sowohl weniger ressourcenintensiv als auch günstiger im Betrieb ist als das Standardmodell GPT-4o, wodurch Entwickler die KI-Technologie in eine weitaus größere Produktpalette integrieren können.
Es ist ein großes Upgrade für Entwickler und Apps, erweitert aber auch die Funktionen und reduziert die Einschränkungen der kostenlosen Version von chatgpt. GPT-4o mini ist ab heute für Benutzer der Stufen Free, Plus und Team über die ChatGPT-Web- und App für Benutzer und Entwickler verfügbar, während ChatGPT Enterprise-Abonnenten nächste Woche Zugriff erhalten. GPT-4o mini wird ab heute das bestehende kleine Modell des Unternehmens, GPT-3.5 Turbo, für Endbenutzer ersetzen.
Das ältere Modell ist für Entwickler weiterhin über die API verfügbar, wenn sie noch nicht auf 40 Mini umsteigen möchten. Das Unternehmen sagt, dass es das ältere Modell irgendwann aus dem Verkehr ziehen wird, hat aber noch kein Datum festgelegt.
Holen Sie sich Microsoft Office für Windows/Mac für 25 $
229 $ Sparen Sie $204
Lebenslanger Zugriff auf Word, Excel, PowerPoint, Outlook, OneNote, Publisher und Access.
229 $ Sparen Sie $204
GPT-4o ist seit Mai für kostenlose ChatGPT-Konten verfügbar, es gab jedoch Einschränkungen hinsichtlich der Nachfrage. Laut der aktualisierte FAQ-SeiteGPT-4o selbst hat diese Einschränkungen immer noch, aber Sie werden jetzt auf GPT-4o mini statt auf GPT-3.5 heruntergestuft, wenn Sie Ihr Limit erreichen. Theoretisch ist das ein großer Gewinn für diejenigen, die nicht auf ChatGPT Plus aktualisiert haben.
Mit der Einführung von GPT-4o mini, das jetzt in der API verfügbar ist und heute in ChatGPT eingeführt wird, machen wir fortschrittliche KI weiterhin für alle zugänglich. https://t.co/sTxtOfUapJ
— OpenAI (@OpenAI) 18. Juli 2024
Laut Daten von Künstliche AnalyseOpenAIs neuestes KI-Modell erreichte 82 % beim MMLU-Benchmark und übertraf damit Gemini 1.5 Flash um 3 % und Claude 3 Haiku um 7 %. Zum Vergleich: Der bisher höchste MMLU-Benchmark wurde gesetzt von google-says-its-gemini-ai-outperforms-both-gpt-4-and-expert-humans/“ target=“_blank“ rel=“noopener“ data-vars-target-url=“https://www.newscientist.com/article/2406746-google-says-its-gemini-ai-outperforms-both-gpt-4-and-expert-humans/“>Gemini Ultra, Googles KI der Spitzenklasse, mit einer Punktzahl von 90 %.
Darüber hinaus behauptet OpenAI, dass der Betrieb von GPT-4o mini 60 % günstiger ist als der von GPT-3.5 Turbo. Entwickler zahlen 15 Cent pro Million Eingabetoken und 60 Cent pro Million Ausgabetoken. OpenAI sagt, GPT-4o mini sei „das leistungsfähigste und kosteneffizienteste kleine Modell, das heute erhältlich ist“, pro CNBC.
Woher kommen diese Kosteneinsparungen? Nun, nicht jede Aufgabe, die durch KI verbessert werden kann, erfordert die volle Leistungsfähigkeit und Leistungsfähigkeit eines vollwertigen Modells wie GPT, Claude oder Gemini. Wie das Erschlagen von Fliegen mit einem Vorschlaghammer ist die Verwendung eines LLM in Standardgröße für einfache, aber umfangreiche Aufgaben übertrieben und verschwendet sowohl Geld als auch Rechenressourcen. Hier kommen kleine LLMs wie Gemini 1.5 Flash von Google, Llama 3 8b von Meta oder Claude 3 Haiku von Anthropics ins Spiel. Sie können diese einfachen, sich wiederholenden Aufgaben schneller und kosteneffizienter ausführen als die größeren Iterationen.
Laut OpenAI wird GPT-4o mini ein Kontextfenster derselben Größe haben, 128.000 Token (etwa der Inhalt eines Buches), wie die Vollversion, und auch der Wissens-Cutoff, Oktober 2023, ist gleich, obwohl das Unternehmen die genaue Größe des neuen Modells nicht angegeben hat. Die API des Modells bietet derzeit nur Text- und Bildfunktionen, aber Video und Audio werden in Zukunft ebenfalls verfügbar sein.
Die Ankündigung erfolgt nur wenige Wochen, nachdem OpenAI im Rahmen von GPT-4o ein lang erwartetes Update seines erwarteten, erweiterten Sprachmodus bereitgestellt hat. Das Update des Unternehmens deutete darauf hin, dass Ende Juli noch eine kleinere Alpha-Version erscheinen soll und eine breitere Einführung für diesen Herbst geplant ist.