9. November (Reuters) – Der ChatGPT-Hersteller OpenAI gab am Donnerstag bekannt, dass er beabsichtige, mit Organisationen zusammenzuarbeiten, um öffentliche und private Datensätze für das Training von Modellen der künstlichen Intelligenz (KI) zu erstellen.
Der beliebte Chatbot ChatGPT, der aus einfachen Eingabeaufforderungen Gedichte und Prosa generieren kann, basiert auf großen Sprachmodellen, die vollständig auf im Internet verfügbaren Open-Source-Daten trainiert werden.
Die neuesten Bemühungen des Unternehmens könnten dazu beitragen, differenziertere Trainingsdaten zu erstellen, die einen verständlicheren Stil haben.
„Wir suchen insbesondere nach Daten, die menschliche Absichten zum Ausdruck bringen, und zwar in jeder Sprache, jedem Thema und jedem Format“, sagte das Unternehmen in einem Blogbeitrag.
OpenAI sagte, es suche nach Partnern, die ihm bei der Erstellung eines Open-Source-Datensatzes für das Training von Sprachmodellen helfen. Dieser Datensatz sei öffentlich und könne von jedem für das Training von KI-Modellen verwendet werden, hieß es.
Das Unternehmen sagte, es bereite auch private Datensätze für das Training proprietärer KI-Modelle vor.
Berichterstattung von Jaspreet Singh in Bengaluru; Bearbeitung durch Shilpi Majumdar
Unsere Standards: Die Thomson Reuters Trust-Grundsätze.