Ein mysteriöser KI-Chatbot mit der Bezeichnung „gpt2-chatbot“ war kurzzeitig online verfügbar, bevor er anschließend wieder verschwand. Der Chatbot feierte still und leise sein Debüt auf der Website LMSYS Chatbot Arena – einer Website, die zum Benchmarking, Vergleichen und Ranking verschiedener KI-Systeme dient.
Aufgrund seines Namens chatgpt-gpt2-sam-altman-openai-b2537934.html“>einige spekulieren dass es sich bei dem Tool möglicherweise um eine frühere Version des Chatbot-Sprachmodells GPT-2 von OpenAI handelt. Benutzer haben jedoch festgestellt, dass das Sprachmodell genauso leistungsfähig oder sogar leistungsfähiger zu sein scheint als GPT-4, das neuere und fortschrittlichere Sprachmodell von OpenAI.
Tatsächlich stellten einige Internetnutzer fest, dass das Sprachmodell bei bestimmten Tests besser abschnitt als GPT-4. Dies hat zu Spekulationen geführt, dass der „gpt2-chatbot“ ein früher Prototyp von GPT-5 oder vielleicht eine aktualisierte, fortgeschrittene Version von GPT-4 sein könnte, die im Grunde genommen als GPT-4.5 betrachtet werden kann.
Vielen Dank für die unglaubliche Begeisterung unserer Community! Das haben wir wirklich nicht kommen sehen.
Nur ein paar Dinge zur Klärung:
– Im Einklang mit unserer Richtlinie haben wir in der Vergangenheit mit mehreren Modellentwicklern zusammengearbeitet, um der Community Zugang zu unveröffentlichten Modellen/Checkpoints zu bieten (z. B.…)
– lmsys.org (@lmsysorg) 30. April 2024
Doch Nutzer, denen es gelang, das Modell zu testen, bevor es offline genommen wurde, stellten fest, dass es überraschend wenig Informationen darüber gab, was das Sprachmodell war und woher es kam. Dennoch dauerte es nicht lange, bis das Sprachmodell wieder offline genommen wurde, und LMSYS sagte in einem Tweet: „Im Einklang mit unserer Richtlinie haben wir in der Vergangenheit mit mehreren Modellentwicklern zusammengearbeitet, um der Community Zugang zu unveröffentlichten Modellen/Checkpoints zu bieten.“ (z. B. mistral-next, gpt2-chatbot) für Vorschautests.“
Die Website fügte dann hinzu, dass sie den gpt2-Chatbot aufgrund „hohen Datenverkehrs und hoher Kapazitätsgrenzen“ „vorübergehend“ deaktivieren musste.
Spekulationen über „gpt2-chatbot“ nehmen zu
Danke an a nachfolgender Tweet Laut OpenAI-CEO Sam Altman scheint es sich bei dem Sprachmodell eher um etwas Neues als um ein früheres Modell von GPT-2 zu handeln.
Altman schrieb: „Ich habe eine Schwäche für GPT-2“, bevor er den Tweet später so bearbeitete, dass er als „gpt-2“ erschien. Und um noch mehr Öl ins Feuer zu gießen, schrieb OpenAI-Mitarbeiter Steven Heidel: twittern sagen: „wenn gpt-2.“
Basierend auf diesen Antworten scheint es eher wahrscheinlich, dass es sich, wie von LMSYS angedeutet, um ein unveröffentlichtes Modell handelt.
Ausgewähltes Bild: Franz Bachinger aus Pixabay