Claude 3, das neueste KI-Modell des KI-Startups Anthropic, wurde auf den Markt gebracht. AWS hat kürzlich angekündigt, dass Claude 3 Dienste auf Amazon Bedrock bereitstellen wird. Kürzlich hat ein ausländischer YouTuber ein Video erstellt, in dem Claude 3 und ChatGPT verglichen werden. Er verwendete sogar den Titel „Endlich gibt es eine KI, die GPT schlagen kann“ und lobte die hervorragende Leistung von Claude 3 in Bezug auf Leistung und Kosteneffizienz in hohem Maße.
Matt Wolfe, ein amerikanischer YouTuber, der sich auf die Bewertung von Produkten für künstliche Intelligenz und Technologie spezialisiert hat, hat kürzlich ein Video gepostet, in dem er Claude 3 und ChatGPT vergleicht. Matt verwendet benutzerdefinierte sieben Kategorien: kreativ, Logik, Codierung, zusammenfassende Dokumente, Bildbeschreibung, Voreingenommenheit und Preisgestaltung. Der Teststandard besteht darin, Claude 3 Opus (im Folgenden als Opus bezeichnet), Claude 3 Sonnet (im Folgenden als Sonnet bezeichnet) und zu fragen GPT-4 anhand der in jeder Kategorie gestellten Fragen und vergleichen Sie die Unterschiede zwischen den drei. Daher glaubt Matt, dass Opus und Sonnet, beide von Claude 3, gut abgeschnitten haben. 4 von 7 Tests schnitten besser ab und die Leistung einzelner Projekte übertraf GPT-4.
Übertrifft GPT-4 in vielerlei Hinsicht
In Bezug auf „Kreativität“ forderte Matt drei künstliche Intelligenzsysteme auf, Wölfe, magische Hämmer und genetische Varianten als Hinweise zu verwenden, um eine heroische Abenteuergeschichte im Text zu erstellen. Matt glaubte, dass alle drei die Grundanforderungen erfüllen könnten, und Sonnet war das schnellste Was die Geschwindigkeit betrifft, sind die von Opus erstellten Geschichten jedoch besser, was die Details und die Vollständigkeit der Geschichte angeht. Er erwähnte, dass GPT-4 die Anforderungen ebenfalls erfüllen kann, seine Leistung jedoch nicht so gut ist wie die von Claude 3.
Was die „Codierung“ angeht, hat Matt drei künstliche Intelligenzsysteme gebeten, einen Code bereitzustellen, damit Benutzer mithilfe der Codierung ein JavaScript-Spiel „Stab zum Sammeln von Goldmünzen“ entwerfen können. Als Ergebnis schnitt Opus am besten ab und machte es in einem richtig go, gefolgt von Sonnet, das ebenfalls nur einmal korrigiert werden muss, um die Kodierung abzuschließen. Im Gegenteil, die Leistung von GPT-4 ist nicht so gut wie erwartet. Nach zwei Korrekturen konnte kein erfolgreicher Code bereitgestellt werden erfüllt die kreativen Anforderungen.
In Bezug auf „Document Abstract“ schickte Matt eine 155 Wörter umfassende Forschungsarbeit zum Thema künstliche Intelligenz an drei Systeme und bat sie, die Kernpunkte des Schreibens der Arbeit weiterzugeben. Infolgedessen konnten alle drei Systeme die Anforderungen erfüllen , aber Sonnet und Opus schnitten besser ab und konnten ausführlicher beschreiben und gleichzeitig die wichtigsten Punkte klären. Matt erwähnte ausdrücklich, dass Opus kürzlich einen „Nadel im Heuhaufen“-Test durchgeführt hatte: Tester versteckten Antworten nach dem Zufallsprinzip in einer großen Textmenge, um zu sehen, ob die KI die „Nadel im Heuhaufen“ genau finden konnte Heuhaufen“ für die Frage. „), Inhalte finden, die nicht mit dem Text übereinstimmen, und sogar fragen, ob der relevante Inhalt in den Text eingefügt wurde, um zu testen, „ob die KI ihn bemerken kann“. Matt betonte insbesondere die Leistung von Claude 3 beim „Finden der Nadel im Heuhaufen“ ist weitaus besser als das von GPT -4.
Was „Bildbeschreibung“ und „Meinungen zu bestimmten Themen“ betrifft, glaubt Matt, dass die Leistung der drei ähnlich ist. Sie können beispielsweise das von ihm bereitgestellte Bild genau beschreiben und Hintergrundinhalte, Kleidung, Farbe, Wortlaut und andere Informationen darstellen. Unter anderem kann GPT-4 bei der Beschreibung von Aktiendiagrammen mehr Informationen als Bilder liefern als Claude 3, aber die Leistung der drei ist nicht weit voneinander entfernt. Matt holte auch gezielt die Meinungen der künstlichen Intelligenz zu kontroversen Themen wie „Die Auswirkungen der Amtsübernahme von Trump oder Biden“, „Die Auswirkungen der Abbruchkultur auf die Gesellschaft“, „Die Auswirkungen von Marihuana auf die Gehirnentwicklung“ usw. ein. Er wies darauf hin die alle drei Systeme bieten. Bei den Vor- und Nachteilen handelt es sich um ausgewogene Meinungen, und es gibt keine spezifische Voreingenommenheit zugunsten einer Position.
Darüber hinaus stellte Matt zwei Fragen auf, um die „logischen“ Berechnungsmöglichkeiten der drei zu vergleichen. Eine davon ist die klassische Logikfrage „Gatekeeper of Heaven and Hell“. Matt sagte, dass alle drei Systeme richtige Antworten liefern können, aber die Antworten sind sich sehr ähnlich. Es ist schwer zu sagen, ob die Trainingsmodule auf ähnliche Fragen trainiert wurden; eine andere Frage testet, ob das System der künstlichen Intelligenz aus unvollständigen Informationen auf die Antwort schließen kann. Matt glaubt, dass GPT-4 präzise antworten kann und eine bessere Leistung erbringt. aber die Videokommentare haben viele Leute verteidigt Claude 3, sagen, dass Matts Beschreibung des Logikproblems mehrdeutig sei und Sonnet und Opus beeinflussen könnte. In Bezug auf „Logik“ scheinen weitere Tests erforderlich zu sein, um die Ergebnisse zu vergleichen.
Claude 3 ist preislich sehr konkurrenzfähig
Schließlich glaubt Matt, dass die „Preisgestaltung“ und die Kosteneffizienz von Sonnet besser sind als die von GPT-4. Er wies darauf hin, dass Sonnet als System unter Claude 3 zur kostenlosen Nutzung durch die Öffentlichkeit in puncto „Kreativität“ besser abschneidet als das kostenpflichtige GPT. „Programmierung“ und „Zusammenfassung von Dokumenten“. -4 ist besser. Es wird auch erwähnt, dass die Leistung von Sonnet beeinträchtigt wird, wenn Benutzer häufig KI zur Unterstützung bei der Codierung und Organisation von Dokumentinhalten verwenden müssen, ohne das tägliche Nutzungslimit von Sonnet (ca. 10 Nachrichten pro Tag). Man kann sagen, dass es tadellos und kosteneffektiv war und alle sehr gut funktionierten.
Viele Menschen zahlen eine monatliche Gebühr für die Nutzung von Claude 3, es bestehen jedoch zwangsläufig Bedenken hinsichtlich der Sicherheit und des unzureichenden Supports bei der Nutzung. Tatsächlich können Benutzer auch Amazon Bedrock von AWS verwenden, um mit Claude 3 problemlos an Text, Bildern und Diagrammen zu arbeiten. Darüber hinaus wird durch die Verwendung der Amazon Bedrock-Plattform sowohl die Hardware- als auch die Softwareleistung verbessert, und Claude Die Echtzeit-Interaktionsgeschwindigkeit von 3 wird verbessert. Außerdem wird es deutlich schneller sein und genauere und zuverlässigere Antworten liefern. Im Gegensatz zu den oben genannten Bedenken ermöglicht die Amazon Bedrock-Plattform Benutzern, das Trainingsmodell benutzerspezifischer Daten zu vereinfachen und Claude 3 an individuelle Bedürfnisse anzupassen, ohne blind für den Elefanten sein zu müssen.
(Dieser Artikel wurde geschrieben von HK entkabeln Nachdruck mit Genehmigung; Quelle des ersten Bildes:Anthropisch)
Weiterführende Literatur:
Neue wissenschaftliche und technologische Erkenntnisse, die von Zeit zu Zeit aktualisiert werden