Vor fünf Jahren verfügten nur sehr wenige Unternehmen über irgendeine Form von KI in der Produktion. Die meiste KI war noch experimentell. Einer (von vielen) Gründen dafür war, dass die Kunst des maschinellen Lernens in der Produktion (MLOps) noch in den Kinderschuhen steckte. Mittlerweile ist MLOps relativ gut etabliert – gerade rechtzeitig, um neue operative Fähigkeiten erforderlich zu machen – LLMOps (Operational Practices for Large Language Models)! In diesem Artikel beschreibe ich, was MLOps war und ist, welche Teile meiner Meinung nach für LLMs weiterhin relevant sind und welche neuen Herausforderungen die aktuelle LLM-Welle für die Operationalisierung für Unternehmen mit sich bringt.

Was ist MLOps?

MLOps (oder maschinelles Lernen in der Produktion) bezieht sich auf die Reihe von Praktiken, Fähigkeiten und Werkzeugen, die erforderlich sind, um ein Modell für maschinelles Lernen (oder Deep Learning oder KI) in die Produktion zu bringen und dabei Korrektheit, Ethik, Governance und Sicherheit zu gewährleisten. MLOps enthält mehrere Unterkategorien. Kontinuierliche Integration und kontinuierliche Bereitstellung konzentrieren sich beispielsweise auf den Prozess der Bereitstellung und Integration neuer Modellversionen sowie die damit verbundene Validierung, während sich ML Observability (oder ML Health) auf die Überwachung des ML-Modellverhaltens in der Produktion konzentriert. Eine Kombination von Technologien für jeden Bereich bildet zusammen eine gute MLOps-Praxis.

Was ist ein großes Sprachmodell?

Large Language Models (oder LLMs) sind die jüngste (und bedeutendste) Weiterentwicklung der Natural Language Processing – oder NLP. Angetrieben durch Technologien wie Transformer Und Reinforcement Learning mit menschlichem Feedback (RLHF), Große Sprachmodelle werden auf riesigen Datensätzen trainiert und sind in der Lage, eine Reihe von Aufgaben wie Textzusammenfassung, Inhaltsgenerierung, Frage/Antwort und mehr zu erledigen. Durch chatgpt wurde das allgemeine Bewusstsein für LLMs gestärkt und sie sind jetzt in einer Vielzahl von Anwendungsfällen einfach und praktisch nützlich, vom Schreiben von E-Mails und Marketingtexten bis hin zur Erstellung von Lerntools. Aufgrund ihrer Verbreitung sind auf sie gezielte MLOps äußerst wichtig.

Einzigartige Herausforderungen großer Sprachmodelle

MLOps waren nur wenige Jahre älter als große Sprachmodelle, aber große Sprachmodelle bringen bereits neue Herausforderungen mit sich, die sich zumindest von herkömmlichen Modellen für maschinelles Lernen oder Deep Learning unterscheiden (wenn nicht sogar komplexer). Zum Beispiel

  • Der Begriff der ML-Modellqualität für einfachere überwachte Lernmodelle kann durch Metriken wie Genauigkeit für Klassifizierungsmodelle (z. B. Modelle, die Ja/Nein für die Krankheitsdiagnose sagen) oder Fehler für Regressionsmodelle (z. B. Modelle, die Immobilienpreise vorhersagen) erfasst werden ). LLMs erzeugen jedoch Sprache als Antworten auf eine Sprachaufforderung. Diese Modelle können neben der Korrektheit (die nach wie vor von entscheidender Bedeutung ist) an vielen anderen Maßstäben gemessen werden. Weitere Messgrößen können die Kohärenz der Antwort, die Angemessenheit für das Publikum, die Fähigkeit, geeignete Referenzen zu zitieren, die Qualität der Ausgabe – schweift das Modell weiter oder kommt es auf den Punkt usw. usw.
  • Komplexes Fehlerverhalten. LLMs können subtile Formen der Voreingenommenheit aufweisen, wie z. B. die Änderung des Tons einer Antwort für einen männlichen gegenüber einem weiblichen Benutzer oder subtile Änderungen in der Wortwahl der Antwort abhängig von der wahrgenommenen Rasse des Kunden.
  • Inkonsistentes Verhalten im Laufe der Zeit. Dieses Konzept existierte bereits in MLOps – allgemein als Drift bezeichnet. Die Idee dahinter ist, dass sich das Verhalten eines Modells im Laufe der Zeit auf eine Weise ändern kann, die von seinen Erstellern nicht beabsichtigt war, beispielsweise wenn sich Fragen auf eine Art und Weise ändern, die der Trainingssatz nicht erwartet hat, oder wenn Datensätze aktualisiert werden. In LLMs können solche Drifts komplexer werden. Beispielsweise kann die gleiche Frage zu unterschiedlichen Antworten führen – und das ist für ein LLM normal. Wenn sich die Muster dieser Antworten jedoch im Laufe der Zeit ändern, kann dies zu einem Problem für Produkte werden und zu Verwirrung oder Unmut bei den Benutzern führen.
Siehe auch  100.000 ChatGPT-Logins auf Dacrnet durchgesickert | Blockchain24

Geht es hier nur um ChatGPT (und Freunde)?

NEIN. ChatGPT (und Konkurrenten mögen google.com/“ target=“_blank“ class=“color-link“ title=“https://bard.google.com/“ rel=“nofollow noopener noreferrer“ data-ga-track=“ExternalLink:https://bard.google.com/“ aria-label=“Bard“>Barde) sind vielleicht die bekanntesten LLMs, aber sie sind keineswegs die einzigen. Unternehmen erstellen bereits benutzerdefinierte LLMs mit speziellem domänenspezifischem Wissen, wie z Bloomberg GPT. Viele dieser Modelle stehen auch online zum Download bereit. Zum Beispiel eine zufällige Suche nach Der Modell-Hub von Hugging Face (eines der größten Modell-Repositories der Welt) für transformatorbasierte Modelle im Finanzbereich enthüllt 95 Modelle, die bereits zum Download verfügbar sind. Einige davon wurden allein im letzten Monat mehr als eine Million Mal heruntergeladen. Es ist klar, dass LLMs ein schnell wachsendes praktisches Segment der KI-Lösungslandschaft sind.

Was können wir von MLOps nutzen und was müssen wir hinzufügen?

Es gibt Debatten darüber, ob LLMOps ein neuer Bereich oder lediglich eine Teilmenge von MLOps ist. Ich glaube, dass ein Großteil von MLOps immer noch der Kern von LLMOps ist. Zu den Bereichen, in denen Einfluss genommen werden kann, gehören die Methoden für die Bereitstellung und Integration, die Notwendigkeit einer Governance, die erforderliche Zusammenarbeit zwischen IT-Teams, KI-Teams und benutzerorientierten Teams usw. Die Bereiche, in denen neue Arbeit erforderlich sein wird, liegen überall dort, wo die Struktur großer Sprachen vorliegt Modelle stellen neue Herausforderungen dar, die bisher in ML- oder sogar großen DL-Modellen nicht zu sehen waren. Diese Herausforderungen liegen in der Regel in

  • Maßstab: Diese Modelle sind enorm groß und kosten viel Ressourcen für das Training und die Abstimmung. Während Deep-Learning- und Reinforcement-Learning-Modelle früher einen großen Maßstab generierten, gibt es viele Modelle für maschinelles Lernen, deren Maßstab vergleichsweise viel kleiner war. Ein großer Maßstab bringt größere Herausforderungen bei der Ressourcenverwaltung mit sich, beispielsweise bei der Verwaltung der GPU-Kosten.
  • Qualität – wir lernen immer noch, wie man das Verhalten dieser Modelle richtig testet, bewertet und überwacht – und wie man ein Modell richtig mit einem anderen vergleicht. Die Metriken entwickeln sich noch weiter, und daher stellen Modellbewertungen vor der Bereitstellung, A/B-Tests und Modellüberwachung alle LLM-spezifische Herausforderungen dar.
  • Datensatzverwaltung – Die Größe und der Umfang dieser Modelle können neue Elemente im Datensatzverwaltungsstapel ergeben – beispielsweise Vektordatenbanken.
Siehe auch  OpenAI: ChatGPT verliert zum ersten Mal seit dem Start des Chatbots Benutzer

Für Unternehmen – wie man anfängt

Meiner Ansicht nach besteht der einfachste Einstieg darin, sich auf die Anwendung dessen zu konzentrieren, was wir bereits aus MLOps wissen. Wie bei MLOps deutet alles darauf hin, dass es der Weg ist, mit der Technologie Schritt zu halten und der Konkurrenz einen Schritt voraus zu sein, indem man mit einem praktischen Anwendungsfall beginnt, nebenbei lernt und so schnell wie möglich iteriert.

Die zweiten wichtigen Punkte, um mit dem sich entwickelnden Bereich von MLOps in Bezug auf LLMs Schritt zu halten – wie z. B. LLM-spezifische Techniken für Leitplanken, Sicherheit, Qualität und Überwachung. Erwarten Sie, dass sich dieser Raum sogar von Monat zu Monat schnell verändert. Allerdings ist die Iteration immer noch der beste Weg, um zu lernen und Fachwissen zu entwickeln.

Ob LLMOps zu einer eigenen Kategorie oder zu einer Teilmenge von MLOps wird, spielt auf lange Sicht eigentlich keine Rolle. LLMs sind von Dauer und der Mehrwert, den sie für die meisten Unternehmen bieten können, ist enorm. Entscheidend ist, was Ihre Organisation durch den Einsatz von LLMs lernt und wie schnell sie es lernen kann.

Folge mir auf Twitter oder LinkedIn.

Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein