27. Oktober 2023 – Datasaur, eine Datenkennzeichnungsplattform für die Verarbeitung natürlicher Sprache (NLP), hat heute LLM Lab eingeführt, eine Schnittstelle für Datenwissenschaftler und Ingenieure zum Erstellen und Trainieren benutzerdefinierter LLM-Modelle wie chatgpt. Das Produkt bietet Benutzern eine breite Palette von Funktionen zum Testen verschiedener Fundamentmodelle, zum Herstellen einer Verbindung zu ihren eigenen internen Dokumenten, zum Optimieren von Serverkosten und mehr.

Der Anstieg der Nutzung von LLMs als Instrument hat im vergangenen Jahr zugenommen. Tatsächlich gaben 61,6 % der Befragten in einer aktuellen Umfrage an, dass sie LLMs (z. B. ChatGPT und Github Copilot) für mindestens einen Anwendungsfall wie Chatbots, Kundensupport und Codierung verwenden. Gleichzeitig verbieten Unternehmen wie apple, Amazon und Spotify ihren Mitarbeitern den Zugriff auf OpenAI-Dienste unter Berufung auf geschäftliche und Datenschutzbedenken. Diese Unternehmen versuchen zunehmend, ihre eigenen internen Lösungen zu entwickeln. LLM Lab bietet einen umfassenden Ausgangspunkt für solche Teams.

„Wir treten regelmäßig mit Data-Science-Teams auf der ganzen Welt in Kontakt, die ihre eigenen LLMs aufbauen möchten“, sagte Ivan Lee, CEO und Gründer von Datensaurier. „Wir haben ein Tool entwickelt, das die häufigsten Schwachstellen ganzheitlich anspricht, sich schnell entwickelnde Best Practices unterstützt und unsere charakteristische Designphilosophie anwendet, um den Prozess zu vereinfachen und zu rationalisieren. Im vergangenen Jahr haben wir maßgeschneiderte Modelle für unseren eigenen internen Gebrauch und für unsere Kunden erstellt und geliefert. Auf der Grundlage dieser Erfahrung konnten wir ein skalierbares, benutzerfreundliches LLM-Produkt entwickeln.“

Datasaur arbeitet mit Unternehmen wie google und Blackbird zusammen, um Daten 5,9-mal schneller zu kennzeichnen als die manuelle Kennzeichnung. Das Unternehmen hat die letzten vier Jahre damit verbracht, eine umfassende NLP-Lösung zu entwickeln, die Methoden wie Entitätserkennung, Textklassifizierung, Sprechertagebücher und mehr unterstützt. Da die generative KI die Aufmerksamkeit der Branche auf sich gezogen hat, ergänzt LLM Lab die bestehende NLP-Plattform von Datasaur, um eine zentrale Anlaufstelle für alles rund um Text, Dokumente und Audio zu bieten. Das Unternehmen beobachtet einen zunehmenden Trend hin zu einem hybriden Ansatz, der traditionelle NLP-Modelle durch LLM-Funktionen ergänzt. Die Plattform von Datasaur unterstützt Datenwissenschaftler nun bei beiden Ansätzen und ermöglicht ihnen sogar, Ansätze zu kombinieren und LLMs zu verwenden, um die Datenkennzeichnung für traditionelle Modelle zu automatisieren.

Siehe auch  Forscher veröffentlichen Angriffsalgorithmus für ChatGPT und andere LLMs

Im Jahr 2024 werde Datasaur weiter in die LLM-Entwicklung investieren, um seine Position als führende NLP-Plattform der KI-Branche zu festigen. LLM Lab hilft dabei, die erfolgreichsten Konfigurationen und Eingabeaufforderungen zu speichern und ermöglicht es Benutzern, ihre Ergebnisse mit Kollegen zu teilen. Die Integration mit beliebten und aufstrebenden Foundation-Modellen wie LlaMa 2, Falcon und Claude sowie mit Technologien wie Pinecone LLM wird fortgesetzt, um sich nahtlos in die Arbeitsabläufe des Modelltrainings einzufügen.

Anzeige

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein