Das KI-Startup Anthropic hat Claude 3 veröffentlicht, die neueste Version seines großen Sprachmodells, das angeblich leistungsfähiger ist als GPT-4 von OpenAI.

Claude 3 wurde am Montag angekündigt und ist in drei verschiedenen Größen erhältlich: Opus, Sonett und Haiku [badly formatted PDF]. Opus ist das leistungsstärkste der drei und steht Entwicklern und Benutzern über die API von Anthropic und das Claude Pro-Abonnement zur Verfügung. Entwickler können über eine API auf Sonnet zugreifen und betreiben derzeit den kostenlosen Web-Chatbot von Anthropic. Das kleinste Modell, Haiku, ist noch nicht verfügbar.

In akademischen Benchmark-Tests – bei denen die Fähigkeit von LLMs bewertet wird, allgemeines Wissen zu behalten, mathematische Probleme zu lösen, Code zu generieren und Argumentationsfähigkeiten zu zeigen – schnitt Opus besser ab als OpenAIs GPT-4 und Googles Gemini Ultra, Anthropic-Berichte. Der Entwickler ging sogar so weit, zu prahlen, dass Opus „ein nahezu menschliches Maß an Verständnis und Geläufigkeit bei komplexen Aufgaben an den Tag legt und damit die Grenze der allgemeinen Intelligenz anführt.“

Mittlerweile sind Sonnet und Haiku leistungsfähiger als das vorherige GPT-3.5-Modell von OpenAI, aber weniger leistungsfähig als die Gemini Ultra- und Pro-Modelle von google.

Anthropic erklärte, dass das Kontextfenster – die Menge an Eingaben, die es gleichzeitig verarbeiten kann – zunächst 200.000 Token betragen wird, aber bis zu einer Million Token erreichen kann.

Opus ist teuer und für Benutzer konzipiert, die KI für Aufgaben nutzen möchten, die ein Höchstmaß an Datenverständnis und -generierung erfordern – wie wissenschaftliche Forschung oder die Analyse langer, komplexer Berichte. Es kostet 15 US-Dollar, eine Eingabeaufforderung zu verarbeiten, die sich über eine Million Token erstreckt, und 75 US-Dollar, um eine Million Token für die Ausgabe zu generieren. Zum Vergleich: OpenAI verlangt zwischen 10 und 30 US-Dollar für die Verarbeitung und Generierung einer Million Token auf seinem GPT-4 Turbo-Modell.

Siehe auch  OpenAI suspendiert Entwickler hinter ChatGPT-Bot, der sich als Präsidentschaftskandidat der US-Demokraten ausgibt - BW Businessworld

Sonnet richtet sich an Mainstream-Unternehmensbenutzer, die ein leistungsfähiges und dennoch schnelles Modell benötigen, das beispielsweise Informationen suchen und abrufen, Marketingtexte schreiben oder Code generieren kann. Es wurde für den Einsatz in großem Maßstab optimiert und kostet 3 US-Dollar bzw. 15 US-Dollar für die Verarbeitung einer Million Token am Ein- bzw. Ausgang. Haiku wird sogar noch günstiger sein und 0,25 US-Dollar kosten. Die Verarbeitung und Generierung einer Million Token kostet 1,25 US-Dollar. Es sollte für Dinge wie Inhaltsmoderation, Sprachübersetzung oder Kundenservice nützlich sein.

Amazon kündigte an, dass es die Claude 3-Modelle von Anthropic auf seiner Cloud-Plattform Bedrock hosten wird: Sonnet heute und Opus und Haiku in Kürze. Ähnlich verhält es sich mit dem Vertex AI Model Garden von Google Cloud: Sonnet ist heute in der privaten Vorschau verfügbar, der API-Zugriff auf alle drei Modelle wird in Kürze verfügbar sein.

Claude 3 ist auch weniger vorsichtig als sein Vorgänger. Claude 2.1 weigerte sich oft, Aufforderungen Folge zu leisten, die nicht unbedingt schädlich waren – etwa der Aufforderung, eine fiktive Geschichte zu schreiben. Die Ankündigung des Entwicklers versicherte Benutzer: „Wir haben in diesem Bereich bedeutende Fortschritte gemacht: Opus, Sonnet und Haiku verweigern die Beantwortung von Aufforderungen, die an die Leitplanken des Systems grenzen, deutlich seltener als frühere Modellgenerationen.“

Das größte Problem, das LLMs plagt, ist jedoch ihre Tendenz, ungenaue Informationen zu generieren oder Dinge so selbstsicher zu erfinden, dass die Benutzer es durchaus glauben könnten. Die als Halluzinationen bezeichneten Fehler machen es schwierig, den Ergebnissen von KI-Software zu vertrauen, geschweige denn, Computern mehr Autonomie bei Aufgaben zu geben.

Siehe auch  Kann ChatGPT die Fragen Ihrer Kunden beantworten?

Anthropic versprach, dass Opus im Vergleich zu Claude 2.1 eine „zweifache Verbesserung“ der Genauigkeit bietet und eine Funktion einführen wird, die Quellen in den von seinen neuesten Modellen generierten Ausgaben zitiert, damit Benutzer sie überprüfen können. Das ähnelt beispielsweise Google Gemini, das in einigen Antworten auf Eingabeaufforderungen auch angibt, woher die Informationen stammen.

„Wir glauben nicht, dass die Modellintelligenz auch nur annähernd ihre Grenzen erreicht, und planen, in den nächsten Monaten häufige Updates für die Claude-3-Modellfamilie zu veröffentlichen. Wir freuen uns auch, eine Reihe von Funktionen zu veröffentlichen, um die Fähigkeiten unserer Modelle zu verbessern.“ , insbesondere für Unternehmensanwendungsfälle und groß angelegte Bereitstellungen“, heißt es in der Ankündigung von Anthropic abschließend.

Interessanterweise hat sich Anthropic dafür entschieden, Claude 3 nicht zu einem multimodalen System zu machen. Im Gegensatz zu chatgpt oder Gemini kann es zwar Bilder verarbeiten, diese aber nicht erzeugen und keine Audio- oder Videoeingaben verarbeiten. ®

5/5 - (396 votes)
Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein