Seit der Veröffentlichung von GPT-4 im März letzten Jahres wird über die Veröffentlichung und die potenziellen Fähigkeiten von GPT-5 spekuliert. Mit sehr wenig Kommentar von OpenAI zu diesem Thema.
Für ein Unternehmen mit einem „offenen“ Namen ist OpenAI fast so verschlossen wie apple, wenn es um neue Produkte geht, und lässt sie aus dem Nichts auf X fallen, wenn sie das Gefühl haben, dass die Zeit reif ist.
Business Insider berichtet jedoch, dass das Flaggschiffmodell bereits in diesem Sommer auf chatgpt auf den Markt kommen könnte und dass es sich „erheblich“ von GPT-4 unterscheiden wird.
Die Grundlage für die Gerüchte über die Sommerveröffentlichung scheinen Drittunternehmen zu sein, die frühzeitig Zugriff auf das neue OpenAI-Modell haben. Diese Unternehmenskunden von OpenAI sind Teil des Geschäftslebens des Unternehmens und erwirtschaften erhebliche Einnahmen, um die wachsenden Kosten für den Betrieb immer größerer Modelle zu decken.
Wird GPT-5 diesen Sommer veröffentlicht?
Gerüchte über die Veröffentlichung im Sommer stehen im Widerspruch zu dem, was OpenAI-CEO Sam Altman in seinem Interview mit vorgeschlagen hat Lex Fridman. Er sagte, dass es dieses Jahr zwar neue Modelle geben werde, diese aber nicht unbedingt GPT-5 sein müssten.
„Wir werden dieses Jahr ein fantastisches Modell herausbringen, ich weiß noch nicht, wie wir es nennen werden“, sagte er. „Ich denke, bevor wir über ein GPT-5-Modell sprechen, müssen wir zunächst viele andere wichtige Dinge veröffentlichen. »
Dazu könnte das Sora-Video-KI-Modell gehören, das laut OpenAI-CTO Mira Murati noch vor Ende dieses Jahres veröffentlicht werden soll.
Altman enthüllte erstmals, dass GPT-5 im November letzten Jahres mit dem Training begonnen habe und dass es zwar nicht viel größer als sein Vorgänger sei, es aber sinnvoll sei, dass es monatelange Arbeit erfordern könnte.
Der Business Insider-Bericht legt nahe, dass sie über die Schulung hinausgegangen sind und zum „Red Teaming“ übergegangen sind, insbesondere wenn sie Drittunternehmen Vorführungen anbieten. Dies setzt jedoch voraus, dass es sich um GPT-5 handelt.
Im roten Team wird das Modell auf die Probe gestellt und auf Sicherheitsaspekte getestet. Der nächste Schritt nach dem Red Teaming besteht darin, das Modell zu verfeinern, während des Tests gemeldete Probleme zu beheben und Leitplanken hinzuzufügen, um es für die öffentliche Veröffentlichung vorzubereiten.
Allein dieser Schritt könnte Monate dauern, wie es bei GPT-4 der Fall war, und daher könnte das, was als Veröffentlichung von GPT-5 in diesem Sommer vorgeschlagen wird, tatsächlich eher GPT-4.5 ähneln. Schließlich wurde Bing Anfang des Jahres ein gelöschter OpenAI-Blogbeitrag zugespielt, der sich auf GPT-4.5-Turbo bezog.
Dies hängt mit Versionen früherer Generationen zusammen, die von GPT-3 bis GPT-3.5 vor der Veröffentlichung von GPT-4 reichen. Wir haben auch GPT-3.5-Turbo und dann GPT-4-Turbo gesehen, jetzt kostenlos in Microsoft Copilot verfügbar.
Was können wir von GPT-5 erwarten?
Dies ist mein Gespräch mit Sam Altman (@sama), sein zweites Mal im Podcast. Wir sprechen über die Boardroom-Saga, den Elon-Prozess, Ilya, Sora, GPT-5, 7 Billionen US-Dollar an Computern, Open Source und AGI. Es war ein wirklich faszinierendes Gespräch. Es ist hier in voller Länge auf X und auf YouTube verfügbar, … pic.twitter.com/h2ANXZpcrz18. März 2024
Altman hat zuvor erklärt, dass GPT-5 eine große Verbesserung gegenüber allen Modellen der vorherigen Generation darstellen wird. Dazu gehören Videofunktionen – etwa die Fähigkeit, den Inhalt von Videos zu verstehen – und eine deutlich verbesserte Argumentation.
Abgesehen von aufsehenerregenden Kommentaren während der Interviews wurden nur wenige spezifische Details preisgegeben. Wir wissen, dass es wahrscheinlich größer sein wird und mehr Parameter als GPT-4 haben wird, aber es ist unklar, in welchem Umfang.
Wir erfahren gerade Details zur Größe des Vorgängers. Jensen Huang, CEO von Nvidia, verriet auf der GDC, dass GPT-4 über 1,8 Billionen Parameter verfügt und für das Training 30 Yottaflops Rechenleistung benötigt – das ist so, als ob eine Milliarde PS5 93.000 Jahre lang ununterbrochen laufen würden.
Wir wissen jedoch nicht, ob sie die neuen exaFLOP-GPU-Plattformen von Nvidia zum Trainieren von GPT-5 verwendet haben. Ein relativ kleiner Cluster von Blackwell-Chips in einem Rechenzentrum könnte ein Billionen-Parameter-Modell in Tagen statt in Wochen oder Monaten trainieren.
Altman sagte, es sei viel intelligenter als die Vorgängermodelle. „Ich bin froh, dass es intelligenter ist“, sagte Altman in seinem Interview mit Fridman. „Die Situation verbessert sich in allen Bereichen. »
Zuerst gab es Spekulationen, dass GPT-5 der erste Hinweis auf übermenschliche Intelligenz sein würde, auch bekannt als künstliche allgemeine Intelligenz (AGI), aber es scheint zunehmend, dass es gewonnen hat, selbst wenn es ein Sprung von GPT-4 sein würde 'T. Das ist ein großer Schritt nach vorne.