Claude 3, das neueste KI-Modell des KI-Start-ups Anthropic, wurde auf den Markt gebracht. AWS hatte zuvor angekündigt, dass Claude 3 Dienste auf Amazon Bedrock bereitstellen wird. Vor ein paar Tagen hat ein ausländischer Youtuber ein Video erstellt, in dem er Claude 3 und chatgpt vergleicht, und sogar den Titel „Endlich gibt es eine KI, die GPT schlagen kann“ verwendet, in dem er die hervorragende Leistung von Claude 3 in Bezug auf Leistung und Kosteneffizienz hoch lobt.
Matt Wolfe, ein amerikanischer Youtuber, der sich auf Kommentare zu Produkten der künstlichen Intelligenz und Technologie spezialisiert hat, hat kürzlich ein Video veröffentlicht, in dem er Claude 3 und ChatGPT vergleicht. Matt verwendet angepasste „creativly“ (creativly), „logic“ (logic), „coding“ (coding), „sumrizing docs“, „image description“ (vision) und „meinungen zu bestimmten themen“. Die sieben Hauptbereiche von ( Bias) und „Preisgestaltung“ werden als Teststandards verwendet. Stellen Sie entsprechend den in den einzelnen Bereichen gestellten Fragen Claude 3 Opus (im Folgenden als Opus bezeichnet), Claude 3 Sonnet (im Folgenden als Sonnet bezeichnet) und GPT-4. Die Antwort besteht darin, die Unterschiede zwischen den dreien zu vergleichen. Daher glaubt Matt, dass Opus und Sonnet, beide von Claude 3, gut abgeschnitten haben. 4 von 7 Tests schnitten besser ab und die Leistung einzelner Projekte übertraf GPT-4.
Übertrifft GPT-4 in vielerlei Hinsicht
In Bezug auf „Kreativität“ forderte Matt drei künstliche Intelligenzsysteme auf, Wölfe, magische Hämmer und genetische Mutationen als Hinweise zu verwenden, um eine heroische Abenteuergeschichte im Text zu erstellen. Matt glaubte, dass alle drei die Grundanforderungen erfüllen könnten, und Sonnet war das schnellste Was die Geschwindigkeit betrifft, sind die von Opus erstellten Geschichten jedoch besser, was die Details und die Vollständigkeit der Geschichte angeht. Er erwähnte, dass GPT-4 die Anforderungen ebenfalls erfüllen kann, seine Leistung jedoch nicht so gut ist wie die von Claude 3.
Was die „Codierung“ angeht, hat Matt drei künstliche Intelligenzsysteme gebeten, einen Code bereitzustellen, damit Benutzer mithilfe der Codierung ein JavaScript-Spiel „Stab zum Sammeln von Goldmünzen“ entwerfen können. Als Ergebnis schnitt Opus am besten ab und machte es in einem richtig go, gefolgt von Sonnet, das ebenfalls nur einmal korrigiert werden muss, um die Kodierung abzuschließen. Im Gegenteil, die Leistung von GPT-4 ist nicht so gut wie erwartet. Nach zwei Korrekturen konnte kein erfolgreicher Code bereitgestellt werden erfüllt die kreativen Anforderungen.
Als „Dokumentzusammenfassung“ schickte Matt eine 155 Wörter umfassende Forschungsarbeit zum Thema künstliche Intelligenz an drei Systeme und bat sie, die Kernpunkte der Arbeit zusammenzufassen. Infolgedessen konnten alle drei Systeme die Anforderungen erfüllen, aber Sonnet und Opus schnitten besser ab und konnten die wichtigsten Punkte ausführlicher beschreiben und klären. Matt erwähnte ausdrücklich, dass Opus kürzlich einen „Nadel im Heuhaufen“-Test durchgeführt hatte: Tester versteckten Antworten nach dem Zufallsprinzip in einer großen Textmenge, um zu sehen, ob die KI die „Nadel im Heuhaufen“ genau finden konnte Heuhaufen“ für die Frage. „), Inhalte finden, die nicht mit dem Text übereinstimmen, und sogar fragen, ob der relevante Inhalt in den Text eingefügt wurde, um zu testen, „ob die KI ihn bemerken kann“. Matt betonte insbesondere die Leistung von Claude 3 beim „Finden der Nadel im Heuhaufen“ ist weitaus besser als das von GPT -4.
Was „Bildbeschreibung“ und „Meinungen zu bestimmten Themen“ betrifft, glaubt Matt, dass die Leistung der drei ähnlich ist. Sie können beispielsweise das von ihm bereitgestellte Bild genau beschreiben und Hintergrundinhalte, Kleidung, Farbe, Wortlaut und andere Informationen darstellen. Unter anderem kann GPT-4 bei der Beschreibung von Aktiendiagrammen mehr Informationen als Bilder liefern als Claude 3, aber die Leistung der drei ist nicht weit voneinander entfernt. Matt holte auch gezielt die Meinungen der künstlichen Intelligenz zu kontroversen Themen wie „Die Auswirkungen der Amtsübernahme von Trump oder Biden“, „Die Auswirkungen der Abbruchkultur auf die Gesellschaft“, „Die Auswirkungen von Marihuana auf die Gehirnentwicklung“ usw. ein. Er wies darauf hin dass alle drei Systeme ausgewogene Meinungen vertreten, sowohl positive als auch negative, ohne auf eine bestimmte Position voreingenommen zu sein.
Darüber hinaus stellte Matt zwei Fragen auf, um die „logischen“ Berechnungsmöglichkeiten der drei zu vergleichen. Eine davon ist die klassische Logikfrage „Gatekeeper of Heaven and Hell“. Matt sagte, dass alle drei Systeme richtige Antworten liefern können, aber die Antworten sind sich sehr ähnlich. Es ist schwer zu sagen, ob die Trainingsmodule auf ähnliche Fragen trainiert wurden; eine andere Frage testet, ob das System der künstlichen Intelligenz aus unvollständigen Informationen auf die Antwort schließen kann. Matt glaubt, dass GPT-4 präzise antworten kann und eine bessere Leistung erbringt. aber die Videokommentare haben viele Leute verteidigt Claude 3, sagen, dass Matts Beschreibung des Logikproblems mehrdeutig sei und Sonnet und Opus beeinflussen könnte. In Bezug auf „Logik“ scheinen weitere Tests erforderlich zu sein, um die Ergebnisse zu vergleichen.
Claude 3 ist preislich sehr konkurrenzfähig
Schließlich glaubt Matt, dass die „Preisgestaltung“ und die Kosteneffizienz von Sonnet besser sind als die von GPT-4. Er wies darauf hin, dass Sonnet als System unter Claude 3 zur kostenlosen Nutzung durch die Öffentlichkeit in puncto „Kreativität“ besser abschneidet als das kostenpflichtige GPT-4 „, „Programmierung“ und „Dokumentzusammenfassung“. 4 ist besser. Es wird auch erwähnt, dass Sonnets, wenn Benutzer häufig KI zur Unterstützung bei der Codierung und Organisation von Dokumentinhalten verwenden müssen, Sonnets tägliche Nutzungsbeschränkung (ca. 10 Nachrichten pro Tag) ausschließt Man kann sagen, dass die Leistung tadellos und kostengünstig war. Alle haben eine sehr gute Leistung erbracht.
Viele Menschen zahlen eine monatliche Gebühr für die Nutzung von Claude 3, es bestehen jedoch zwangsläufig Bedenken hinsichtlich der Sicherheit und des unzureichenden Supports bei der Nutzung. Tatsächlich kann Claude 3 über Amazon Bedrock von AWS problemlos für die Arbeit mit Text, Bildern und Diagrammen verwendet werden. Darüber hinaus wird durch die Verwendung der Amazon Bedrock-Plattform sowohl die Hardware- als auch die Softwareleistung verbessert und die reale Leistung verbessert Die Interaktionsgeschwindigkeit von Claude 3 wird ebenfalls verbessert. Sie wird deutlich schneller sein und präzisere und zuverlässigere Antworten liefern. Im Gegensatz zu den oben genannten Bedenken ermöglicht die Amazon Bedrock-Plattform Benutzern, das Trainingsmodell der proprietären Daten der Benutzer zu vereinfachen und Claude 3 an ihre individuellen Bedürfnisse anzupassen, ohne blind für den Elefanten sein zu müssen.
Wenden Sie sich an den Vertrieb, um Informationen zu Amazon Bedrock-Anwendungsfällen für Unternehmen in Hongkong zu erhalten:Klicken Sie auf diesen Link Melden Sie sich für die neuesten Veranstaltungen an, um mehr über Amazon Bedrock zu erfahren: :Klicken Sie auf diesen Link
Probieren Sie jetzt Amazon Bedrock aus:Klicken Sie auf diesen Link Über Claudes neueste Modelle:Klicken Sie auf diesen Link Über die neuesten Modelle von Mistral AI:Klicken Sie auf diesen Link AWS-Entwicklerblog:Klicken Sie auf diesen Link AWS-Entwickler-Community:Klicken Sie auf diesen Link
In Verbindung stehende Artikel:
[Lehre]GPT Store eröffnet offiziell ChatGPT AI Girlfriend + ein Foto, das Ihnen beim Nachdenken über Rezepte hilft GPT4All kann KI ohne Internetzugang nutzen[Lehre]Offline-Installation + VPN-freier Praxistest Das neue E-Book von AWS stellt KI-Anwendungen vor und erklärt generative KI entsprechend den Bedürfnissen verschiedener Startups.