Internationale Sprachmodelle im großen Maßstab werden meist mit vereinfachten chinesischen Materialien trainiert, die anfällig für Informationsverzerrungen sind oder nicht mit der taiwanesischen Kultur und Werten vereinbar sind. Aus diesem Grund hat der Nationale Wissenschaftsrat die TAIDE (Trustworthy AI Dialogue Engine, Trustworthy AI Dialogue Engine) ins Leben gerufen )-Projekt im April letzten Jahres. Erstellen Sie ein groß angelegtes Sprachmodell exklusiv für Taiwan.
Das TAIDE-Team führte eine Bestandsaufnahme der Daten des öffentlichen und privaten Sektors durch, verhandelte individuelle Genehmigungen, sortierte insgesamt 89,4 GB hochwertiger traditioneller chinesischer Daten aus und baute GPU-Rechenressourcen auf. Im Dezember letzten Jahres schloss es die Integration mit Taiwan Shan-2 ab Bereitstellung von EDV-Dienstleistungen. Das TAIDE-Team hat derzeit die Modelle TAIDE-7B (kommerzielle Version) und TAIDE-13B (akademische und Forschungsversion) entwickelt, die mehrere Dialogrunden durchführen und unangemessene Antworten blockieren können.
Die Leistung von TAIDE bei den fünf Hauptaufgaben Artikel schreiben, Briefe schreiben, Abstracts, Englisch-Chinesisch-Übersetzung und Chinesisch-Englisch-Übersetzung ist vergleichbar mit ChatGPT, das das GPT 3.5-Modell dahinter verwendet. Insbesondere die Testergebnisse beim Schreiben von Artikeln, Das Schreiben von Briefen und Zusammenfassungen sind besser als ChatGPT.
Das TAIDE-Team wird neue Anwendungen mit Partnern besprechen, wobei der Schwerpunkt auf der Unterstützung des öffentlichen Sektors bei der Implementierung von TAIDE liegt. Wu Zhengzhong, Vorsitzender des National Science Council, sagte den Medien am 20., dass die TAIDE-7B-Version bereits Mitte April dieses Jahres als Open Source veröffentlicht werde und nicht nur von der Außenwelt frei genutzt werden könne, sondern auch Das Modell soll künftig in Computer, Mobiltelefone und andere Geräte eingebaut werden.
Wu Zhengzhong betonte auch, dass Menschen, egal ob sie nach ChatGPT oder TAIDE fragen, die Fähigkeit haben müssen, selbst zu urteilen. „Letztendlich sind Sie selbst die wahre Person, die dafür verantwortlich ist. Sie müssen dieses Konzept haben. Werfen Sie es nicht weg, nachdem Sie danach gefragt haben. Das ist völlig falsch“, sagte er.
Darüber hinaus erklärte Liao Junzhi, Präsident der Academia Sinica, in seinem Geschäftsbericht an den Legislativ-Yuan vom 20., dass zur Bereicherung der TAIDE-Datenbank die Academia Sinica-Datenbank so weit wie möglich geöffnet werde, um das Training von KI-Modellen zu unterstützen ohne gegen die Vorschriften zum Schutz des geistigen Eigentums zu verstoßen.
Es ist äußerst wichtig, taiwanesische Sprachmodelle im großen Maßstab zu entwickeln. Das ultimative Ziel wird darin bestehen, TAIDE zu integrieren, um KI-Anwendungen zu implementieren und sie allen Menschen zugänglich zu machen.
(Das erste Bild zeigt Wu Zhengzhong, Vorsitzender des Nationalen Wissenschaftsrates, die Quelle des ersten Bildes: Science and Technology News)