Es dauerte nicht lange, bis Claude 3 Opus chatgpt überholte. Das jüngste große Sprachmodell von Anthropic ist die Nummer eins bei Chatbot Arena.
Schließen Sie 3 Arbeiten ist das erste große Sprachmodell (LLM), das GPT-4 seit dem Start von Chatbot Arena im Mai 2023 übertrifft. Vor dem Start gab Anthropic bekannt, dass sein LLM neue Maßstäbe für eine Vielzahl kognitiver Aufgaben setzen wird. Diese neue Spitzenposition bestätigt dies.
Chatbot-Arena ist irgendwie ein Römisches Amphitheater und die großen Vorbilder der Sprache sind ihre Gladiatoren. Die LLMs konkurrieren daher in dieser virtuellen Arena.
Es handelt sich um eine von der Forschungsorganisation entwickelte Plattform Große Modellsystemorganisation (LMSYS). Zu seinen Mitgliedern zählen Professoren und Studierende aus Universitäten von Kalifornien in Berkeley und San Diegosowie das prestigeträchtige Carnegie Mellon Universität.
Chatbot Arena wird somit zur Bewertung von LLMs eingesetzt. GPT-4Motor des beliebten ChatGPT D'OpenAIwar die einzige Zahl seit dem Start der Plattform.
Die Rankings von Chatbot Arena basieren nicht nur auf den Fähigkeiten des Models. Seine Entwicklung basiert hauptsächlich auf der menschliche Vorlieben.
Das offene Plattform arbeitet nach a Paarweiser Vergleichsansatz. Seine Methodik basiert ebenfalls auf Crowdsourcing.
Dies bedeutet, dass diese virtuelle Arena für LLM genutzt wird Beiträge einer vielfältigen Nutzerbasis. Seit Mai 2023 hat sich dieser angesammelt mehr als 240.000 Stimmen.
Chatbot Arena ist zweifellos nicht die einzige Plattform ihrer Art. Allerdings ist sein Ranking gehören zu den am häufigsten zitierten. Die riesigen Unternehmen der künstlichen Intelligenz verlassen sich in erheblichem Maße auf ihre Ergebnisse.
Claude 3 Opus beeindruckt Entwickler
Anthropic präsentiert sich als Hauptkonkurrent von OpenAI auf dem Markt für künstliche Intelligenz. Die Leistung seiner aktuellen Modellfamilie bestätigt dies.
Sie sollten wissen, dass das LLM Opus ist der fortschrittlichste in der Familie Claude 3. Beachten Sie, dass Letzteres auch die Modelle umfasst Sonett et Haiku. Letztere belegen jeweils die den vierten und sechsten Platz der Chatbot Arena-Rangliste.
Darüber hinaus kommt Claude 3 Opus an unterstützen komplexe Analysen. Seine Fähigkeiten erlauben es ihm auch längere Aufgaben bewältigen bestehend aus mehreren Etappen. Die neue Nummer eins Generative KI besonders hervorragend für High-Level-Codierung und für die Mathematik.
« Ich hatte gerade eine lange Programmiersitzung mit Claude 3 Opus und es zerschmettert GPT-4 absolut », teilte dieser Entwickler auf X mit, nachdem er das Modell getestet hatte.
Dieser andere Programmierer zögert nicht, von „ der Tod des Königs ».
Opus überzeugt Entwickler. „ Die besten verfügbaren Modelle: Opus für fortgeschrittene Aufgaben, Haiku für Kosten und Effizienz „, denken Simon Willisonunabhängiger Forscher für künstliche Intelligenz.
Niedergang von ChatGPT, hin zur Hegemonie von Claude?
Seit ihrer Verfügbarkeit Anfang dieses Monats Die Modelle Claude 3 haben sich rasant weiterentwickelt in der Chatbot-Arena-Rangliste. Dies trotz der Konkurrenz durch verschiedene Versionen von GPT-4.
Dieser Erfolg hat bereits einige Nutzer von KI-Assistenten dazu veranlasst Ersetzen Sie ChatGPT. « Das Verrückteste an dieser Geschichte Claude 3 > GPT-4 ist die Leichtigkeit, mit der man sich einfach (…) verändern kann », Gepostet dieser Entwickler in sozialen Netzwerken.
Darüber hinaus erzählt er Verwenden Sie ChatGPT viel seltener seit der Veröffentlichung von Claude 3 Opus. Der Programmierer plant nicht, vor größeren Updates bei OpenAI zurückzukehren.
Andererseits sieht Willison diese Situation eher positiv. „ Wir alle profitieren von a Vielfalt führender Anbieter in dieser Domäne », denkt der Forscher.
Denken Sie daran, dass GPT-4 mehr als ein Jahr alt ist. Die Tatsache, dass OpenAI einen Schritt zurückgetreten ist, hat es der Konkurrenz ermöglicht, aufzuholen.
- Teilen Sie den Artikel:
Unser Blog wird von Lesern betrieben. Wenn Sie über Links auf unserer Website einkaufen, verdienen wir möglicherweise eine Affiliate-Provision.