Das KI-Unternehmen Anthropic gibt einen Ausblick auf seine neue „Familie“ von Claude-3-Modellen, von denen es behauptet, dass sie Googles Gemini und OpenAIs chatgpt in mehreren Benchmarks übertreffen können.
Das Die Gruppe besteht aus drei KIs mit unterschiedlichem Grad an „Fähigkeit“. Ganz unten steht Claude 3 Haiku, gefolgt von Claude 3 Sonnet, und dann ist da noch Claude 3 Opus als Spitzenreiter. Anthropic behauptet, dass das Trio aufgrund seiner Multimodalität, seiner verbesserten Genauigkeit, seines besseren Kontextverständnisses und seiner Geschwindigkeit auf ganzer Linie eine „starke Leistung“ erbringt. Bemerkenswert an dem Trio ist auch, dass es eher bereit ist, schwierige Fragen zu beantworten.
Anthropic erklärt, dass ältere Versionen von Claude sich manchmal weigerten, auf Aufforderungen zu antworten, die die Grenzen der Sicherheitsleitplanken überschritten. Jetzt wird die Familie Claude 3 mit ihren Antworten einen differenzierteren Ansatz verfolgen, der es ihr ermöglicht, diese kniffligen Fragen zu beantworten.
Trotz der allgemeinen Leistungssteigerung konzentriert sich ein Großteil der Ankündigung darauf, dass Opus in all diesen Bereichen der Beste ist. Sie gehen sogar so weit zu sagen, dass das Modell „ein nahezu menschliches Verständnisniveau aufweist …“ [for] komplexe Aufgaben“.
Spezialisierte KIs
Um es zu testen, hat Anthropic Opus einer „Needle In a Haystack“- oder NIAH-Bewertung unterzogen, um zu sehen, wie gut es Daten abrufen kann. Wie sich herausstellte, ist es ziemlich gut, da sich die KI Informationen nahezu perfekt merken konnte. Das Unternehmen behauptet weiter, dass Opus ein ziemlich intelligenter Cookie sei, der mathematische Probleme lösen, Computercode generieren und bessere Argumente liefern könne als GPT-4.
Die Technologie ist nicht ohne Macken. Auch wenn Anthropic angibt, dass ihre KIs eine verbesserte Genauigkeit haben, besteht immer noch das Problem von Halluzinationen. Die von den Modellen ausgegebenen Antworten können falsche Informationen enthalten, obwohl sie im Vergleich zu Claude 2.1 stark reduziert sind. Außerdem ist Opus etwas langsam, wenn es um die Beantwortung einer Frage geht, mit einer Geschwindigkeit, die mit Claude 2 vergleichbar ist.
Das heißt natürlich nicht, dass Haiku oder Sonnet weniger wichtig sind als Opus, da sie spezifische Anwendungsfälle haben. Haiku ist zum Beispiel großartig darin, schnelle Antworten zu geben und Informationen „aus unstrukturierten Daten“ zu gewinnen. Außerdem ist es bei der Beantwortung mathematischer Fragen nicht so gut wie Opus. Sonnet ist ein größeres Modell, das Menschen dabei helfen soll, bei einfachen Aufgaben Zeit zu sparen und sogar Textzeilen aus Bildern zu analysieren, während Opus ideal für groß angelegte Operationen ist.
Das Internet verändern
Sowohl Sonnet als auch Opus sind derzeit käuflich zu erwerben, obwohl es eine gibt kostenlose Version von Claude auf der Unternehmenswebsite. Für Haiku wurde kein Veröffentlichungstermin genannt, aber Anthropic gibt an, dass es bald erscheinen wird.
Wie Sie wahrscheinlich erraten können, ist das Claude 3-Trio eher für Unternehmen gedacht, die bestimmte Arbeitslasten automatisieren möchten. Ihre Erfahrung mit der Gruppe wird wahrscheinlich in Form eines Online-Chatbots erfolgen. Amazon hat kürzlich die Umsetzung angekündigt Anthropics neue KIs in AWS (Amazon Web Services) bietet Websites auf der Plattform die Möglichkeit, ein individuelles Claude-3-Modell zu erstellen, das den Bedürfnissen von Marken und ihren Kunden entspricht.
Wenn Sie auf der Suche nach einem alltagstauglichen Modell sind, sehen Sie sich die Liste der besten KI-Content-Generatoren von TechRadar für 2024 an.