chatgpt konkurriert, und verwenden Sie weniger Daten, um bessere Ergebnisse zu erzielen“ src=“https://static.leiphone.com/uploads/new/images/20230530/647593ad8c6db.png?imageView2/2/w/740″/>
Durch die Nutzung einer großen Menge an Wissen durch einheitliche Anweisungen in natürlicher Sprache hat ChatGPT die Art und Weise verändert, wie Menschen mit KI interagieren, und wird den Interaktionsmodus und die zugrunde liegende Architektur weiterer Software weiter verändern.
Im wirklichen Leben sind beispielsweise alle Lebensbereiche mit massiver Datenverarbeitung verbunden, z. B. dem Ausfüllen der vierteljährlichen Umsatzdaten von Unternehmen in Berichten, der Aufzeichnung von Wertpapiermarkttransaktionsdaten und Markttrendschwankungen, der Verarbeitung medizinischer Grafikdaten für Versicherungspolicen usw. Das Extrahieren von Daten aus unstrukturierten grafischen Informationen und das Sortieren der von den Benutzern benötigten Informationen erfordert jedoch häufig viel Personal und Zeit.
Kürzlich sagte Kevin Kelly, der Gründungs-Chefredakteur des Magazins „Connection“, in einem Interview mit den Medien, dass er mit einem Standpunkt übereinstimmt, dass die Menschen in Zukunft 10 % ihrer Fähigkeiten verbessern müssen , denn die restlichen 90 % werden durch KI ersetzt. Im medizinischen Bereich beispielsweise ist KI besonders gut im Suchen und Analysieren und kann menschliche Ärzte bei der Diagnosestellung unterstützen.
Die Nachfrage der Branche nach großen Modellen nimmt zu. Der Vorteil des grundlegenden großen Modells liegt in seiner Vielseitigkeit. Durch leistungsstarkes grafisches Verständnis und interaktive Methoden besteht das Ziel darin, die ultimative allgemeine künstliche Intelligenz (AGI) zu erreichen. Die B-End-Anforderungen im Szenario spiegeln auch die Mängel eines „kleinen“ wider „Messer mit kleinem Messer“, und es gibt viel Raum für Verbesserungen im Hinblick auf technische Optimierung und Kostenreduzierung.
Zu diesem Thema diskutierte AI Technology Review kürzlich mit Zhang Chaoming, CEO von Shenzhen Yuancode Internet Co., Ltd.
Zhang Chaoming wies darauf hin, dass die großen Modelle von heute ein sehr starkes Mitspracherecht haben und sogar über Leben und Tod einer Ökologie entscheiden können; aus Sicht von Kapital, Technologie und Talenten wird die Eintrittsschwelle für Start-up-Unternehmen gesenkt . Kleine Unternehmen wollen an der Welle der großen Modelle teilhaben, und Zhang Chaoming glaubt, dass die größte Chance im To-B-Markt liegt.
„Anstatt ein groß angelegtes Modell gegen ChatGPT zu erstellen, konzentriert es sich zunächst auf die Privatisierungsbereitstellung und baut ein groß angelegtes Unternehmensmodell mit Branchen-Know-how auf. Zweitens muss geprüft werden, ob das von ChatGPT gelieferte Ergebnis richtig oder falsch ist an den Fachmann übergeben Menschen nutzen professionelles Wissen, um zu urteilen.“
Das Folgende ist das Gespräch zwischen AI Technology Review und Zhang Chaoming:
Auch bei großen Modellen ist Fachwissen für die Teilnahme erforderlich
AI Technology Review: Was halten Sie von den Chancen kleiner Unternehmen im Wandel der Großindustrie?
Zhang Chaoming:Das heutige große Modell schneidet bei der Beantwortung von Fragen in allen Bereichen sehr gut ab, weist jedoch immer noch Mängel bei der Beantwortung von Fragen in Bereichen auf, die professionelles Wissen erfordern. Die Daten zum Berufswissen sind im Internet nicht leicht zu beschaffen und die Ausbildung ist nicht ausreichend.
Beispielsweise sind die Underwriting-Regeln in der Versicherungsbranche oft schwer über öffentliche Kanäle zu erhalten. Dies ist das Kerngeheimnis von Versicherungsunternehmen. Wir können nur aus Fällen lernen, daher besteht das Problem der Ungenauigkeit. Das große Modell kann im professionellen Wissensbereich nur eine Genauigkeit von 60 bis 70 % erreichen. Der Laie mag den Effekt für gut halten, für den Insider ist er jedoch unbrauchbar.
In der Industrie sind 95 % ein Produktionsstandard. Was ist die Bedeutung? Das heißt, ob es 80 % oder 70 % sind, es gibt keinen Unterschied im Produktionsprozess. Der Grund, warum der Beurteilungsstandard der Branche bei 95 % liegt, liegt darin, dass die Genauigkeitsrate des Menschen zwischen 92 % und 98 % liegt und 95 % nur der Mittelwert ist und der Unterschied von einigen Punkten standardmäßig auf vom Menschen verursachte Verluste zurückzuführen ist Eine Frage der Toleranz. Und je mehr im Produktionsprozess, desto geringer ist die Toleranz für die Genauigkeit des Modelleffekts.
In To-C-Szenarien wie der Unterhaltungsindustrie und Pan-Entertainment-Szenarien verwenden wir ChatGPT zum Chatten, Schreiben von Artikeln, Generieren von Bildern und Schreiben von Texten. Wenn wir 60 % erreichen, haben wir das Gefühl, dass der Effekt sehr gut ist, und wir sind sehr zufrieden zufrieden. Aber wenn wir in die Finanzbranche oder eine andere Branche einsteigen, bedeutet das ohne 95-prozentige Genauigkeit im Grunde nichts. Daher ist die Modellgenerierung im Produktionsprozess eine Angelegenheit mit sehr geringen Toleranzen, aber hohen Anforderungen an Genauigkeit und Effizienz.
Ein Trend, den wir erkennen können, ist, dass es für große Modelle schwierig ist, ChatGPT in Bezug auf To C zu übertreffen. Dies wird durch die besondere Umgebung von To C bestimmt. Wenn ein chinesisches Unternehmen ein ChatGPT erstellt, ist es eine Frage, ob Amerikaner es verwenden werden. Dies ist eine sehr wichtige Frage. Dies stellt auch fest, dass es für Modelle inländischer Hersteller schwierig ist, das Niveau von ChatGPT in Bezug auf Korpus, Anzahl der Benutzer usw. zu erreichen, für Chinesen ist es jedoch möglich, es selbst zu verwenden. Ich denke, der Unterschied zwischen ChatGPT und der vorherigen Taobao-Suche besteht darin, dass sie sprachübergreifend ist. Wenn Sie in der Vergangenheit auf Taobao auf Englisch suchen oder auf google Chinesisch verwenden wollten, gab es Sprachprobleme, aber ChatGPT hat das sprachübergreifende Problem sehr gut gelöst.
Daher liegt die größte Chance immer noch im To-B-Markt.
Anstatt ein groß angelegtes Modell gegen ChatGPT zu erstellen, sehen wir zunächst ein groß angelegtes Unternehmensmodell mit Branchen-Know-how, das bei privatisierter Bereitstellung professionelle Wissensergebnisse liefern kann. Der Privatisierungseinsatz löst zwei Probleme: Zum einen den Datenschutz, der den Kern des Privatisierungseinsatzes darstellt, und zum anderen die Professionalität, sodass Benutzer dieses großen Modells sich selbst trainieren müssen. Die von ChatGPT gelieferten Ergebnisse sind richtig oder falsch. Das muss so sein Beurteilung durch menschliches Fachwissen, und die Genauigkeit der Daten kann nicht korrigiert werden. Es bedeutet nicht, dass professionelle Ergebnisse erzielt werden können, indem man Fachwissen hineingießt. Daher müssen Unternehmen auch ihre eigenen großen Modelle trainieren.
AI Technology Review: Was ist der Denkunterschied zwischen der Verwendung eines kleinen Modells zur Erreichung von 95 % der Produktionsstandards und der Verwendung eines großen Modells?
Zhang Chaoming:Es sind zwei Konzepte. Der Vorteil des kleinen Modells besteht darin, dass es im professionellen Bereich das große Modell übertreffen muss. Die Extraktion von Wissen und die Datenerfassung durch die Wissenskarte sind allesamt Vorteile des kleinen Modells, während der Vorteil des großen Modells in seiner Vielseitigkeit von etwa 60 liegt %. . Zum Beispiel möchte ich einen Umfragebericht schreiben und ein Rahmenwerk für einen Umfragebericht schreiben, um diesen Sachverhalt zu beschreiben. Er muss mit einem großen Modell gut geschrieben sein, aber die darin ausgefüllten Daten sind mit einem kleinen Modell professioneller. Für diese Angelegenheit muss also ein großes Modell mit einem kleinen Modell zusammenarbeiten, um es zu vervollständigen.
AI Technology Review: Was ist die Kernlogik hinter großen und kleinen Modellen?
Zhang Chaoming:Bevor das große Modell fertig ist, ist es für die Menschen schwierig, den Wert hinter der Wissenskarte der Branche zu erkennen, sondern nur die enormen Kosten für deren Fertigstellung zu erkennen. Erst als das große Modell populär wurde, wurde die Wissenslandkarte zum Dateninhalt für die Erstellung von Berichten und konnte mehrere Frage- und Antwortrunden usw. unterstützen, bevor sie ihren Wert zeigte.
Wenn aus Sicht der Geschäftslogik nur eine kleine Stichprobe für den Abschluss einer Branchenwissensschulung verwendet werden kann, müssen Menschen Hunderte Millionen oder Milliarden Dollar für die Schulung von Branchenkenntnissen ausgeben, selbst wenn dieser Teil der Kosten gleichmäßig auf verschiedene Unternehmen verteilt wird Während der Verknüpfung muss es zu einem Geldverlust kommen. Die Kernlogik liegt in der Wissenszusammenstellung, der Reservezusammenstellung und wie hoch sind die Kosten? Und das wurde in der Vergangenheit selten gemacht.
Viele Wissensgraphen konnten in der Vergangenheit nur einmal verkauft werden, aber ein gutes Geschäftsmodell sollte über nachhaltige Erneuerungsfähigkeiten verfügen. Das Problem bei einem kleinen Modell besteht darin, dass es zu teuer ist, einen Wissensgraphen zu erstellen. Wenn ein kleines Modellunternehmen bis zu ein oder zwei Milliarden Yuan für den Aufbau einer Wissenskarte ausgeben muss, kommt es wieder darauf an, kein Geld zu verdienen. Die Fähigkeit des großen Modells besteht darin, dass Sie beim Schreiben eines Artikels schöner schreiben und Fragen reibungsloser stellen können, aber die Kernquelle des Wissens wurde noch nicht geklärt. Das heißt, es ist nicht möglich, ein großes Modell zur Führung der Arbeit zu verwenden, da die Kosten zu hoch sind.
Aus diesem Grund basiert der Grund, warum der Kreiscode die Kosten und Ausgaben erheblich reduzieren kann, auf dem von uns vorgeschlagenen Kernextraktionsmodell, das auf selbst entwickelter Technologie aus dem Zeitalter kleiner Modelle basiert. Durch die komplexe semantische Extraktionsfähigkeit des Kernextraktionsmodells ist es möglich, kleine Stichproben zu verwenden, um das Kostenproblem beim Aufbau von Wissensgraphen zu lösen.
Das Zeitalter der KI erfordert ein neues „Betriebssystem“
AI Technology Review: Bietet Circlecode grundlegende große Modelle oder hilft es Kunden, große Modelle zu trainieren?
Zhang Chaoming:Was wir anbieten, ist eine Reihe grundlegender Dinge. In den letzten Jahren war Zero Code besonders beliebt, aber alle anderen wussten sehr gut, dass sein Wert begrenzt war. Meiner Meinung nach handelt es sich nicht um ein generationsübergreifendes und transformatives Produkt, sondern lediglich um ein Werkzeug zur Reduzierung der Arbeitsbelastung im ursprünglichen Ökosystem. Es ist schwierig, es branchenübergreifend für No-Code zu nutzen, aber jetzt ist es unserer Meinung nach KI bereits eine brandneue Ökologie.
Im PC-Zeitalter ist das Betriebssystem König. Im Internet-Zeitalter ist der Browser zum Eingang geworden, und der Eingang ist König. Im mobilen Internet-Zeitalter ist das Betriebssystem (iOS und Android) der König. Der Entwicklungspfad ist sehr klar. Der ganz einfache Grund ist, dass das System ohne eine starke Position ausgenutzt wird.
Daher glauben wir, dass der Unterschied zwischen einem großen Modell und einem Nullcode darin besteht, dass ein großes Modell eine Infrastruktur mit einem sehr starken Mitspracherecht sein muss und sogar über Leben und Tod einer Ökologie entscheiden kann. Was wir wollen, ist ein Betriebssystem, das von jedem Spieler verwendet werden kann. Wir stellen Unternehmen diese Reihe von Dingen zur Verfügung. Die Leute in Unternehmen müssen nicht programmieren können, sondern müssen sich nur mit dem Geschäft auskennen und ihre Geschäftsdaten eingeben auf dieser Reihe von Dingen. Es kann verwendet werden, und Menschen in jedem Bereich können die entsprechende Arbeit sehr einfach erledigen. Dies ist unsere Definition dieses „Betriebssystems“.
Wenn ein Unternehmen beispielsweise einen Forschungsbericht analysieren möchte, muss es 100 Personen entsenden, um diese Aufgabe zu erledigen. Jetzt wird es an das KI-Unternehmen übergeben. Wenn das KI-Unternehmen jedoch auch 80 oder mehr Personen verwenden muss 90 Modellingenieure müssen diese Aufgabe erledigen. Was passiert dann damit? Sehr klein, die Leute, die Geld verloren haben, wechselten vom ursprünglichen Unternehmen zu einem KI-Unternehmen. Dies ist ein Kernproblem. Erst wenn es gelöst ist, kann ein KI-Unternehmen erfolgreich sein Geld.
Der Schlüssel zur Lösung des Problems liegt in der Verwendung des von uns bereitgestellten Betriebssystems, damit das KI-Unternehmen das Problem mit nur einem Modellingenieur und Algorithmus zu 95 % lösen kann, was wertvoll ist.
AI Technology Review: Was sind die Hauptbranchen des aktuellen Kundenstamms von Yuancode?
Zhang Chaoming:Derzeit konzentrieren wir uns nur auf die beiden Branchen Bildung und Krankenversicherung.
Am Beispiel der medizinischen Versorgung analysiert Circle Code hauptsächlich den Fallbericht, wir interpretieren jedoch nicht den Inhalt des Bildberichts, sondern analysieren den aus dem Bildbericht interpretierten Textinhalt. Dieser Teil der Nachfrage wird in der medizinischen Industrie angesiedelt, und es ist schwierig, seine Ökologie zu erkennen, aber die Versicherungsbranche hat eine große Nachfrage nach diesem Teil des Inhalts. Verwenden Sie große Modelle, um medizinische Aufgaben zu erledigen, die Anforderungen der Versicherungsbranche zu übersetzen und die Anforderungen des Versicherungspersonals an Berichtsdaten zu erfüllen.
Im Gegensatz zu Banken sind die meisten Daten in Banken strukturiert, sodass im täglichen Betriebsprozess keine große Nachfrage nach Datenanalysen besteht. Im normalen Betrieb der Bank können etwa 90 % der Dinge mithilfe von IT-Software abgewickelt werden, und die restlichen 10 % werden von Menschen erledigt, z. B. Kreditprüfung usw. Daher ist die Berichtsanalyse in der entsprechenden Arbeit sehr gering Inhalt. Allerdings haben Versicherungsunternehmen die meisten Dinge von Anfang an manuell erledigt und machen 90 % ihres Geschäftsinhalts aus, während KI nur 10 % des Informationszugriffs und der Datenübertragung unterstützt. Der Hauptgrund dafür ist, dass die Datenquellen der beiden sind unterschiedlich. Das eine sind strukturierte Daten und das andere sind unstrukturierte Daten.
Wenn der große Wandel der KI kommt, wird sich vielleicht auch die Bank im Prüfprozess verändern, aber das ist bei weitem nicht so direkt wie der Einfluss der KI auf die Versicherungsbranche.
AI Technology Review: Nachdem der ärztliche Untersuchungsbericht und dieses Formular vorliegen, analysiert der Kreiscode die Daten. Wird er den nächsten Schritt der Analyse und Verarbeitung durchführen?
Zhang Chaoming:Eine weitergehende Analyse und Verarbeitung führen wir nicht durch, da es im Land mehr als 10.000 Menschen gibt, die diese Daten verarbeiten können. Allerdings gibt es nur sehr wenige Unternehmen oder Institutionen, die diese Daten strukturieren und an diese 10.000 Personen weitergeben können.
Wenn die Versicherungsbranche heute medizinische Dateninhalte verarbeiten muss, dauert die manuelle Verarbeitung der Dateneingabe des Berichts oft einen Tag, und die Strukturkosten sind sehr hoch. Mithilfe unseres Modells und unserer Plattform kann die Struktur der Daten geändert werden in Sekundenschnelle erledigt werden. Das ist unsere technische Stärke.
AI Technology Review: Wie lässt sich das Problem der Datenproben lösen?
Zhang Chaoming:Um ein einfaches Beispiel zu nennen: Die Erfahrungsberichte in der Medizinbranche unterscheiden sich in ihrem Stil. Wenn KI-Modelle zur Strukturierung medizinischer Untersuchungsberichte verwendet werden, haben Zehntausende von Berichtsdaten im gleichen Vorlagenformat kaum Auswirkungen auf die technische Forschung des Kreises Code. Wenn es Hunderttausende Arten von medizinischen Untersuchungsberichten gibt, ist es unrealistisch, alle diese Hunderttausende Berichte zu finden und dann ein Modellerkennungstraining durchzuführen. Darüber hinaus ist es für uns schwierig, über das Internet an private Daten wie Versicherungen zu gelangen, und der Handel mit privaten Daten ist verboten. Das Obige ist eine sehr realistische Situation. Wenn das Problem nicht gelöst werden kann, wird es schwierig sein, es zu tragen eine anschließende Ausbildung absolvieren.
In dieser Hinsicht besteht die Idee von Circle Code darin, dass wir unter der Voraussetzung, dass wir nicht 1.000 oder 10.000 Kopien finden können, 20 kleine Beispieldaten finden können. Basierend auf den 20 Daten und unserer Technologie werden sie auf diese anwendbar sein Das Modell der gesamten Branche ist darauf trainiert, Grafik- und Textinformationen in strukturierte Daten umzuwandeln, wobei ein Modell selbst entwickelter zugrunde liegender Technologie übernommen wird und weniger Daten verwendet werden, um bessere Ergebnisse zu erzielen.
Kleine Unternehmen können ein Unternehmen gründen, aber das ist sehr schwierig
AI Technology Review: Kleine Unternehmen wollen ein großes Modellgeschäft starten. Gibt es heute noch eine Chance?
Zhang Chaoming:Es gibt eine Chance, aber es ist auch sehr schwierig. Es hängt davon ab, wer als Erster rauskommt.
Heutzutage wollen kleine Unternehmen ein großes Modellgeschäft gründen. Ich denke, die Schwelle für die Gründung eines Unternehmens ist im Vergleich zur Ära der kleinen Modelle stark gesenkt worden. Gleichzeitig müssen wir aber auch erkennen, dass dies sehr schwierig ist gelingt am Ende. Der Grund, warum es sehr schwierig ist, liegt darin, dass es zunächst über starke wissenschaftliche Forschungskapazitäten verfügen muss, was für Start-up-Unternehmen sehr hohe Kosten erfordert, um Technologie und Talente schnell anzugleichen. Dies ist der erste Punkt.
Der zweite Punkt ist, dass in der aktuellen Situation, egal ob es sich um ein großes oder ein kleines Modell handelt, ein Unternehmen, das nicht über 40 oder 50 Grafikkarten verfügt, das Modell nicht einmal betreiben kann. Die Investitionen in Grafikkarten können leicht mehrere Millionen bis hin zu zweistelligen Millionenbeträgen betragen. Das bedeutet auch, dass eine Seed-Finanzierungsrunde mit einer Investition von zwei bis drei Millionen kaum den Kauf von Hardware-Equipment eines Unternehmens finanzieren kann.
Man kann sagen, dass die beiden oben genannten Probleme die meisten Start-up-Unternehmen getötet haben, daher denke ich, dass es für die aktuellen Start-up-Unternehmen sehr schwierig ist, herauszukommen. Auf dieser reinen Technologiestrecke wurde das Fenster geschlossen.
AI Technology Review: Was ist der Unterschied zwischen einem KI-Unternehmen und einem „KI+“-Unternehmen?
Zhang Chaoming:Der Unterschied liegt darin, welche Fähigkeiten KI für die Dienste und Unternehmen beider bietet. Viele große KI-Startups werden Open-Source-Modelle und Modelle auf Open-Source-Modellen verwenden, aber wir müssen sehen, welche Art von Modellen sie erstellen.
Beispielsweise stellt ein KI-Unternehmen Wertpapierunternehmen die von Wertpapierunternehmen benötigten Daten zur Verfügung und nutzt seine KI-Fähigkeiten, um die Bedürfnisse der Menschen in Wertpapierunternehmen zu erfüllen. Dies wird als KI-Unternehmen bezeichnet. Die Verwendung von KI-Fähigkeiten zur Lösung von Wertpapierproblemen spiegelt das meiste wider Wichtig sind die Modellierungs- und Analysefähigkeiten des Unternehmens im Wertpapierbereich, die wir KI + Wertpapierunternehmen nennen. Die meisten KI-Unternehmen werden Open-Source-Lösungen verwenden, um spezifische Probleme in einer Branche zu lösen, aber ihre Kernkompetenz liegt in der Finanzmodellierung, nicht in der KI-Modellierung.
AI Technology Review: Ist welches Modell für unterteilte Branchen relevant?
Zhang Chaoming:Vor dem großen Modell haben wir ein kleines, in der Branche übliches Modell gemacht, das heißt, jeder Text kann sehr strukturiert verarbeitet werden. Wie sehen Anwälte beispielsweise Verträge, auf welchen Ebenen wollen sie Daten nutzen usw. – diese Fragen können geklärt werden. Ein weiteres Beispiel ist der ärztliche Untersuchungsbericht eines Krankenhauses. Durch unser Modell können alle Daten Kunden zur willkürlichen Überprüfung und Analyse zur Verfügung gestellt werden, und gezielte Daten können auch Unternehmen zur Verfügung gestellt werden.
AI Technology Review: Was ist der Unterschied zum Branchenmodell?
Zhang Chaoming:Das vertikale Großmodell ist nicht auf ein bestimmtes Teilgebiet ausgerichtet, sondern löst auch branchenspezifische Probleme. Am Beispiel der strukturellen Probleme medizinischer Fälle und Erfahrungsberichte kann ich unter der Annahme, dass ein Unternehmen ein groß angelegtes Modell für Diabetes mellitus herstellt, die Zustandsdaten von Diabetikern eingeben und das groß angelegte Modell für Diabetes mellitus zur Lösung verwandter Probleme verwenden Probleme oder es kann auf einem allgemeinen groß angelegten Modell basieren. Grundsätzlich gilt, dass für jede Art von Krankheit dieselben Technologien zur Lösung neuer Krankheiten verwendet werden müssen.
Dies ist das Design des Geschäftsmodells, nicht das Design der Technologie. Mit anderen Worten: Wenn Sie das Datenquellenproblem lösen, lösen Sie nicht wirklich andere Probleme. Aber unserer Meinung nach sollten große Modelle eine Basistechnologie sein, um nicht zu sagen, dass Daten plus Modelldienste zu einem großen Modell werden können. Der zirkuläre Code bietet eine Datenverarbeitungsmethode mit großem Modell und ist letztendlich nicht an der Lösung spezifischer Branchenprobleme beteiligt.
Wie oben erwähnt, benötigt die Versicherungsbranche gut verarbeitete und strukturierte medizinische Daten. Gleichzeitig verfügt sie auch über eine große Anzahl hervorragender Underwriting- und Schadensbearbeitungsmitarbeiter. Diese Art von hochrangigem Personal ist in China nicht rar. Was wir Was Sie tun müssen, ist, diese strukturierten Daten diesen professionellen und qualifizierten Personen zur Analyse zu geben, anstatt sie selbst zu analysieren.
(Leifeng.com Leifeng.com(Öffentliche Nummer: Leifeng.com))