Sina Finance berichtete, dass Insidern zufolge die Version 3.5 des Baidu Wenxin Large-scale Model für interne Tests verfügbar war. Die Few-Shot-Bewertung des Basismodells auf dem öffentlichen Testset zeigt, dass Wenxin Large-scale Model 3.5 (ERNIE 3.5) verfügbar ist Die Ergebnisse mehrerer Testsätze haben die von ChatGPT übertroffen.
Um die umfassenden Fähigkeiten gängiger großer Modelle zu überprüfen, wird die Bewertung anhand der drei maßgeblichen Bewertungsbenchmarks AGIEval, C-Eval und MMLU umfassend bewertet. Neben dem großen Wenxin-Modell 3.5 umfassen die Evaluierungsmodelle auch große Modelle der Serien ChatGPT, GPT-4, ChatGLM und LLaMa. Die Evaluierung kann die Vor- und Nachteile großer Modelle in Bezug auf die Fähigkeiten aufzeigen und gleichzeitig Es spielt auch eine starke Führungsrolle bei der iterativen Entwicklung des Modells.
Den Bewertungsergebnissen nach zu urteilen, verfügt das Wenxin-Modell 3.5 über hervorragende Chinesischfähigkeiten und übertrifft sogar GPT-4; seine umfassenden Fähigkeiten sind etwas schlechter als GPT-4, aber es hat ChatGPT in der Bewertung bereits übertroffen und liegt damit weit vor anderen großen Open-Source-Modellen. Modell.
Wu Hequan, ein Akademiker der Chinesischen Akademie für Ingenieurwissenschaften, sagte einmal, dass chinesische Unternehmen gegenüber ausländischen Unternehmen natürliche Vorteile haben, wenn es um den Erwerb chinesischer Korpusse und das Verständnis der chinesischen Kultur geht. Einerseits verfügt China bereits über eine gute Grundlage; nehmen Sie das Baidu Wenxin Large Model Als Beispiel Version 3.5. Die neue Version des Wenxin-Modells wurde in verschiedenen Fähigkeiten erheblich verbessert.
Es versteht sich, dass die End-to-End-Optimierung der vierschichtigen Architektur der künstlichen Intelligenz von Baidu, insbesondere die gemeinsame Optimierung der Framework- und Modellschichten, die Trainingsgeschwindigkeit und den Modelleffekt des großen Modells von Wenxin beschleunigt hat.
(Dieser Artikel wird gesponsert von MoneyDJ-Neuigkeiten Zum Nachdruck berechtigt; Quelle des ersten Bildes:FilmBildschirmfoto)
Neue Erkenntnisse aus Wissenschaft und Technik, die von Zeit zu Zeit aktualisiert werden