• Google Share Btn

Shutterstock 2277946977chatgpt 3.5″ itemprop=“image“/>

IT Home zitierte Netease Technology am 19. Wu Tian, ​​​​Vizepräsident der Baidu Group und stellvertretender Direktor des National Engineering Research Center for Deep Learning Technology and Application, sagte, dass die neue Version der neuen Generation großer Sprachmodelle und generativer KI-Produkte (künstliche Intelligenz) „Wen „zeigt, dass das große Modell 3.5 von Baidu Wen

Es wird berichtet, dass sich der IDC-Bewertungsbericht auf drei Hauptaspekte konzentriert: Produkttechnologie, Serviceökologie und Industrieanwendung, und mehr als ein Dutzend Indikatoren großer Modelle untersucht. Zu Chinas inländischen Mainstream-Großmodellen gehören Baidu, Alibaba, Tencent, Huawei, HKUST Xunfei, 360 und SenseTime. An dieser Bewertung nahmen 14 Hersteller teil. Die Ergebnisse des Berichts zeigen, dass Baidu Wenxin offensichtliche Vorteile in Bezug auf Modellfähigkeiten, Werkzeugplattformen, ökologisches Layout und Branchenabdeckung hat und früher als geplant in die Explorationsphase der Kommerzialisierungsimplementierung eingetreten ist.

Wu Tian wies weiterhin darauf hin, dass Baidu sich seit 2019 intensiv mit der Forschung und Entwicklung von Pre-Training-Modellen beschäftigt und nacheinander eine Reihe wissensverbesserter Wenxin-Modelle herausgebracht hat. Vor nicht allzu langer Zeit wurde Version 3.5 des Wenxin Large Model offiziell veröffentlicht, das weitere Innovationen in mehreren Kerntechnologien wie Grundmodellen, Wissenserweiterung und Abrufverbesserung hervorgebracht hat. 0 %, die Trainingsgeschwindigkeit wird um das Zweifache und die Argumentationsgeschwindigkeit um das 30-fache erhöht .

In Bezug auf die groß angelegte Modellökologie wies Wu Tian darauf hin, dass Baidu Wenxin ein ökologisches System gebildet hat, das Unternehmen, Bildung und Gemeinschaft integriert. Großmängelmodellkreativität und blühende groß angelegte Modellökologie.

Tian Wu sagte jedoch unverblümt, dass die Industrialisierung großer Modelle immer noch vor großen Herausforderungen stehe. Zusammenfassend gibt es drei Aspekte: Erstens ist die Größe großer Modelle tatsächlich groß, was hohe Trainingsschwierigkeiten und hohe Kosten mit sich bringt. Zweitens sind die Anforderungen an die Rechenleistungsskalierung sehr groß und die Leistungsanforderungen sehr hoch.

Siehe auch  ChatGPT prognostiziert 1.000 US-Dollar im Jahr 2024

Was die Vorhersage des endgültigen Ausgangs des „Hundert-Modell-Krieges“ angeht, glaubt Wu Tian, ​​dass in den letzten Monaten eine große Anzahl neuer Großmodelle aufgetaucht ist, dies jedoch ein stufenweises Phänomen ist. In Zukunft werden verschiedene Unternehmen und Institutionen nach und nach ihre eigene Positionierung finden und sich dann einer eigenen Unterteilung zuwenden.

(Dieser Artikel wird gesponsert von MoneyDJ-Neuigkeiten Zum Nachdruck berechtigt; Quelle des ersten Bildes: Shutterstock)

Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein