OpenAI kündigte am Montag wesentliche Verbesserungen an seinem Flaggschiff-Chatbot chatgpt an, darunter Verbesserungen der Sprach-, Text- und Bildfunktionen, die „schnellere“ Dienste für alle Benutzer verfügbar machen würden, sowie eine neue Desktop-App.
Mira Murati, Chief Technology Officer von OpenAI und (sehr kurz) ehemaliger CEO, sagte während einer Videobesprechung, dass das neueste große Sprachmodell des Unternehmens, GPT-4o, es Entwicklern und anderen Benutzern ermöglichen würde, Konversationssprache, Text, Video und Audio in Echtzeit zu nutzen. Während die Nutzungsbeschränkungen weiterhin die Unternehmensangebote des Unternehmens trennen werden, werden alle Benutzer Zugriff auf die Funktionen des neuen Modells haben, sagte Murati.
„Dies ist das erste Mal, dass wir in puncto Benutzerfreundlichkeit wirklich einen großen Schritt nach vorne machen“, sagte Murati.
In einem BlogeintragCEO Sam Altman sagte, das neue Modell treibe die Mission des Unternehmens voran, fortschrittliche KI-Tools für alle bereitzustellen. „Wir sind ein Unternehmen und werden viele Dinge finden, für die wir Geld verlangen können“, schrieb er. „… und das wird uns helfen, (hoffentlich) Milliarden von Menschen kostenlose, herausragende KI-Dienste anzubieten.“
Für diejenigen, die von den jüngsten Berichten über einen möglichen Deal mit apple und einer gemunkelten Suchmaschinenfunktion, die mit google konkurrieren soll, begeistert gewesen sein könnte, könnte die Ankündigung eine kleine Enttäuschung gewesen sein. Altman lehnte die Aussicht ab, dass diese Entwicklungen Teil der heutigen Ankündigung in einem Beitrag auf
„… der neue Sprach- (und Video-) Modus ist die beste Computerschnittstelle, die ich je verwendet habe“, schrieb Altman. „Es fühlt sich an wie KI aus den Filmen; und es ist für mich immer noch ein bisschen überraschend, dass es echt ist.“
Murati sagte, das neue Modell werde eine verbesserte Geschwindigkeit in bis zu 50 verschiedenen Sprachen bieten und ab heute über die API von OpenAI Entwicklern angeboten werden. „Entwickler können also doppelt so schnell mit dem Bau beginnen, 50 % günstiger und mit fünfmal höheren Ratenlimits“, sagte Murati.
Die Mitglieder des OpenAI-Teams setzten sich auch zusammen, um die Fähigkeiten des neuen Modells zu demonstrieren. Sie demonstrierten die Fähigkeit des Modells, den emotionalen Zustand des Benutzers zu beurteilen, und die Fähigkeit, zu unterbrechen, um Fragen zu klären. Der OpenAI-Forscher Mark Chen zeigte, wie das Modell mit detaillierten Anweisungen zur Atmung sogar zur Beruhigung Ihrer Nerven eingesetzt werden kann – und korrigierte sogar Chen, als er absichtlich hyperventilierte. „Wow, mach mal langsam!“ sagte die ChatGPT-Stimme.
Die Fähigkeit des Modells, bei Code und einfacher Mathematik zu helfen, wurde ebenfalls demonstriert. Interessanterweise wurde die Codierungsdemonstration auf einem MacBook durchgeführt. Bloomberg hatte zuvor Quellen zitiert, denen zufolge das Unternehmen kurz vor einem Deal mit Apple stehe, der ChatGPT-Funktionen in sein nächstes Betriebssystem integrieren würde.
Laut Bloomberg Intelligence wird GenAI ein Bis 2032 soll der Markt 1,3 Billionen US-Dollar groß sein OpenAI, Meta, Google und sein Mutterunternehmen Alphabet sowie Microsoft kämpfen alle um die Position, immer ausgefeiltere große Sprachmodelle zu erstellen. Entsprechend Staatsmannwird der globale Markt für KI im Jahr 2024 184 Milliarden US-Dollar erreichen.