Anthropic, das von ehemaligen OpenAI-Forschern gegründete KI-Unternehmen, hat dies getan enthüllt Sein aktualisierter Chatbot, Claude 2, hat es direkt auf Konkurrenten wie chatgpt und google Bard abgesehen.
Der Nachfolger, der nur fünf Monate nach dem Debüt von Claude erscheint, zeichnet sich durch längere Reaktionszeiten, differenzierte Argumentation und überlegene Leistung aus und schneidet bei den GRE-Prüfungen zum Lesen und Schreiben beeindruckend ab.
Claude 2 gilt als KI-Kraftpaket, das in der Lage ist, bis zu 100.000 Token, was etwa 75.000 Wörtern entspricht, in einer einzigen Eingabeaufforderung zu verarbeiten. Dies ist ein dramatischer Sprung gegenüber Claudes bisherigem Limit von 9.000 Token, der einen einzigartigen Vorteil bietet: die Fähigkeit der KI, Antworten kontextbezogener und besser bereitzustellen.
Das neue Modell hat in mehreren Bereichen, darunter Recht, Mathematik und Codierung, erhebliche Fortschritte gemacht, die durch standardisierte Tests bewertet wurden. Laut Anthropic erreichte Claude 2 im Multiple-Choice-Bereich der Anwaltsprüfung 76,5 % (GPT-3,5). 50,3 % erreicht) und erreichte in den GRE-Prüfungen zum Lesen und Schreiben eine Punktzahl von mehr als 90 % der Bewerber für Graduiertenschulen. Claude 2 erreichte außerdem 71,2 % beim Python-Codierungstest Codex HumanEval und 88,0 % bei GSM8k-Matheaufgaben für die Grundschule, was seine fortgeschrittenen Rechenfähigkeiten unter Beweis stellt.
Wie berichtet von EntschlüsselnClaude von Anthropic verfügt über eine einzigartige „Verfassung“, ein Regelwerk, das von der Allgemeinen Erklärung der Menschenrechte inspiriert ist und es ihm ermöglicht, sich ohne menschliches Feedback selbst zu verbessern, unangemessenes Verhalten zu erkennen und sein eigenes Verhalten anzupassen.
Aber wie schlägt es sich im Vergleich zu den beiden Monarchen des Hügels, ChatGPT und Googles neuem Bard? Beginnen wir damit, wie gut sie bei den technischen Daten abschneiden.
Preis:
- ChatGPT: Kostenlos für Benutzer der GPT-3.5-Version. Wer die leistungsstärkere Version mit GPT-4 nutzen möchte, muss zahlen 20 $ pro Monat für die ChatGPT Plus-Version.
- Claude: Kostenlos
- Barde: Kostenlos
Verfügbarkeit:
Privatsphäre:
- ChatGPT: Ermöglicht Benutzern das Löschen ihrer Interaktionen. Unterstützt das Surfen über VPN nicht.
- Barde: Hat die Möglichkeit, Interaktionen nach 18 Monaten automatisch zu löschen. Ermöglicht Benutzern nicht das Abrufen früherer Interaktionen. Unterstützt VPNs, wodurch es praktisch in jedem Teil der Welt verfügbar ist und politische Beschränkungen umgeht.
- Claude: Ermöglicht Benutzern das Löschen ihrer Konversationen. Unterstützt VPN-Browsing.
Unterstützte Sprachen:
- ChatGPT: Unterstützt über 80 Sprachen.
- Bard: Unterstützt Englisch, Japanisch und Koreanisch.
- Claude: Unterstützt mehrere weit verbreitete Sprachen wie Englisch, Spanisch, Portugiesisch, Französisch, Mandarin und Deutsch. Wenn eine Sprache nicht erkannt wird (oder die Eingabe viele Grammatikfehler aufweist), gibt es einen einleitenden Satz und antwortet dann auf Englisch.
Kontextbehandlung:
- ChatGPT: Die kostenlose Version unterstützt 7.096 Token Im Kontext unterstützt ChatGPT Plus (GPT-4) 8.192 Token. OpenAI bietet eine Version an, die 32K-Tokens unterstützt, diese wird jedoch von ChatGPT nicht verwendet.
- Barde: Unterstützt 8.196 Token des Kontextes.
- Claude: Unterstützt 100.000 Kontext-Tokens – kein Tippfehler.
Merkmale:
- ChatGPT: Die kostenlose Version bietet keine zusätzlichen Funktionen. GPT Plus bietet einen Plugin-Store, einen Code-Interpreter und eine vorübergehend angehaltene Funktion zum Surfen im Internet, die von Microsoft Bing unterstützt wird. Bietet API-Unterstützung.
- Bard: Der Chatbot befindet sich noch in der experimentellen Phase, wird aber über einen Plugin-Store und eine Google Suite-Integration verfügen. Bietet eingeschränkten Zugriff auf seine API.
- Claude: Der Chatbot kann zu Slack hinzugefügt werden und verschiedene Aufgaben wie das Zusammenfassen von Threads, das Bereitstellen von Vorschlägen, Brainstorming usw. übernehmen. Bietet API-Unterstützung.
Der Kampf der Eingabeaufforderungen: ChatGPT vs. Bard vs. Claude
Entschlüsseln nutzten dieselbe Eingabeaufforderung, um die von den drei Chatbots erzielten Ergebnisse zu vergleichen.
Fremdsprachen verstehen
Zuerst fragten wir nach der Bedeutung einer gebräuchlichen spanischen Slangphrase. Claude erwies sich bei seiner Erklärung als vorsichtiger und genauer, ChatGPT lieferte eine ausreichend gute Erklärung, aber Bard weigerte sich zu antworten und argumentierte, dass das Unternehmen kein Spanisch spreche. Als wir jedoch unsere Eingabeaufforderung von „Was bedeutet das?“ in „Was ist das englische Äquivalent zu“ umformulierten, lieferte sie eine bessere Antwort als die von ChatGPT, wenn auch weniger ausführlich als die von Claude AI.
Antwort von Claude 2.
Antwort bereitgestellt von ChatGPT.
Antwort bereitgestellt von Google Bard.
Aktuelle Information
Dann haben wir die Modelle nach dem heutigen Preis von Bitcoin gefragt. Dadurch werden nicht nur Webbrowserfunktionen getestet, sondern auch gemessen, wie viele Informationen sie jeweils auf der Grundlage einer einzelnen Bestellung bereitstellen.
ChatGPT ist fehlgeschlagen. Es ist nicht mit dem Internet verbunden und kann daher keine aktuellen Informationen bereitstellen. Auch Claude hat keine Internetverbindung. Im Gegensatz zu ChatGPT halluzinierte es jedoch eine Antwort mit falschen Informationen. Wenn ein Benutzer etwas fragt und davon ausgeht, dass Claude über eine Internetverbindung verfügt, erhält er eine falsche Antwort, die als richtig erscheint. Google Bard hat die richtigen Informationen bereitgestellt.
Antwort bereitgestellt von ChatGPT.
Antwort von Claude 2.
Antwort bereitgestellt von Google Bard.
Kontextbehandlung
Als nächstes testen wir die Modelle auf ihre Fähigkeit, große Textmengen zu verarbeiten. Wir haben die Bibel als Beispiel genommen und den gesamten Text von Genesis 1:1 bis Exodus 25:39 kopiert (fast 62.000 Wörter). Dann stellten wir eine ganz konkrete Frage aus der im Text enthaltenen Geschichte.
Das einzige Modell, das eine Antwort geben konnte, war erwartungsgemäß Claude. Die Bearbeitung der Aufforderung dauerte etwa 2 Minuten, lieferte aber eine genaue Antwort. Wir verwendeten spezielle Markierungen, um sicherzustellen, dass es sich nicht um Betrug handelte, sondern um die Analyse des Textes, und es erwies sich als meisterhaft.
Antwort von Claude 2.
Nonverbale Fähigkeiten
Abschließend baten wir die Modelle, einige mathematische Aufgaben zu lösen. KI-LLMs sind dafür nicht wirklich konzipiert, und ChatGPT Plus mit GPT-4 ist mit seinem Code-Interpreter wahrscheinlich die beste Option unter den dreien. Wir haben jedoch die drei Modelle getestet und sie gebeten, einen Zahlungsplan für eine Person zu erstellen, die versucht, ihre Kreditkartenschulden zu begleichen. Wir haben die Modelle außerdem gebeten, eine Rangfolge zu erstellen, welche Karten verwendet und welche vermieden werden sollten.
Claude lieferte die umfassendsten Antworten im Hinblick auf den Plan. Es machte jedoch einen Fehler und empfahl uns, Ausgaben für die Karte mit dem höchsten effektiven Jahreszins zu priorisieren.
Antwort von Claude 2.
Der Code-Interpreter von ChatGPT lieferte eine Antwort, bei der wir eine der Karten zu viel bezahlen, was nicht wirklich nützlich ist, wenn jemand Schulden auf anderen Karten hat.
Antwort bereitgestellt von ChatGPT mithilfe des Code-Interpreters.
GPT 3.5 lieferte keine genauen Ergebnisse und forderte uns auf, mehr Geld zu zahlen, als uns tatsächlich zur Verfügung stand.
Antwort bereitgestellt von ChatGPT.
Bard war ziemlich allgemein gehalten. Es ging den sicheren Weg und lieferte keine Zahlen, sondern beschrieb im Grunde die sogenannte Debt Avalanche-Methode.
Antwort bereitgestellt von Google Bard.
Stärken und Schwächen
Claude 2:
- Stärken: Claude 2 verfügt über eine beeindruckende Fähigkeit, große Kontexte mit bis zu 100.000 Token zu verwalten. Es zeigt hervorragende Leistungen in verschiedenen Bereichen wie Jura, Mathematik und Codierung und kann in standardisierten Tests hohe Ergebnisse erzielen. Es kann sich ohne menschliches Feedback selbst verbessern und anpassen und unterstützt VPN-Browsing. Der Chatbot kann auch zur Aufgabenbearbeitung zu Slack hinzugefügt werden und bietet API-Unterstützung.
- Schwächen: Es ist vorübergehend nur in den USA und im Vereinigten Königreich erhältlich. Claude 2 verfügt nicht über eine Internetverbindung und kann falsche Informationen liefern, wenn er nach aktuellen realen Daten gefragt wird. Es kann bei komplexen Aufgaben Fehler machen und wirkt dabei sehr überzeugend.
ChatGPT:
- Stärken: ChatGPT ist das am weitesten verbreitete der drei Modelle und unterstützt über 80 Sprachen. Es bietet außerdem API-Unterstützung und einen Plugin-Store in der ChatGPT Plus-Version.
- Schwächen: Es verfügt im Vergleich zu Claude 2 über eingeschränkte Fähigkeiten zur Kontextverarbeitung. Die kostenlose Version bietet keine zusätzlichen Funktionen und ist viel eingeschränkter und von geringerer Qualität als die kostenpflichtige Version. Die Funktion zum Surfen im Internet ist vorübergehend angehalten und kann keine Echtzeitdaten bereitstellen. Bei einigen komplexen Aufgaben kann es zu unangemessenen Ergebnissen kommen.
Googles Barde:
- Stärken: Bard unterstützt VPN-Browsing. Aufgrund seiner Verbindung zum Internet kann es Echtzeitdaten liefern. Bard plant außerdem die Integration mit Google Suite und das Angebot eines Plugin-Stores.
- Schwächen: Bard unterstützt weniger Sprachen als ChatGPT. Sein API-Zugriff ist begrenzt und seine Fähigkeiten zur Kontextverarbeitung sind geringer als bei Claude 2. Bards Antworten können allgemein und bei einigen komplexen Aufgaben nicht hilfreich sein – was ein vernünftiger Kompromiss ist, wenn der Benutzer das Risiko von Halluzinationen reduzieren möchte.
Abschluss
Da der Bereich der KI-LLMs und Chatbots nun über mehr Optionen verfügt, muss man nicht unbedingt ein ChatGPT-Fan werden oder sich dem reinen Google-Lager anschließen.
Jede Option hat Stärken und Schwächen, die jeden Bot für bestimmte Anforderungen attraktiver machen. Claude verarbeitet große Datenmengen, ist jedoch möglicherweise nicht die beste Wahl für Aufgaben, die Echtzeitdaten erfordern. ChatGPT ist kreativer und eignet sich perfekt für Aufgaben, die eine bestimmte Sprachunterstützung erfordern (und der Plugin-Store ist wirklich gut, wenn Sie bereit sind, den Preis zu zahlen). Auf der anderen Seite ist Bard sachlicher und genauer und nutzt seine Internetverbindung, ist aber möglicherweise nicht die beste Wahl für kreative Aufgaben.
Warum am Ende eines auswählen? Sie müssen sich nicht entscheiden, welches besser ist – Sie können sie alle verwenden.