• Google Share Btn

Viralyft 2Li1Rl5B P4 Unsplashchatgpt generierten Code zu erkennen, entwickelt OpenAI ein neues Modell „CriticGPT“.“ itemprop=“image“/>

OpenAI-Forscher haben das GPT-4-Modell verfeinert und „CriticGPT“ trainiert, Fehler im von ChatGPT generierten Code zu finden, was großen Sprachmodellen dabei hilft, Inhalte genauer zu generieren.

GPT-4 wird für die Steuerung von ChatGPT verwendet, und OpenAI nutzt Reinforcement Learning from Human Feedback (RLHF) zur Ausrichtung. RLHF ist eine Technologie für maschinelles Lernen, die menschliches Feedback zur Feinabstimmung des Modells nutzt, um festzustellen, ob der vom Modell generierte Inhalt kohärent, genau und nicht anstößig ist. KI-Trainer vergeben Bewertungen, die in die Algorithmen zurückfließen, die das Modell steuern. Um Chatbots wie ChatGPT zuverlässiger zu machen und Fehlverhalten zu verhindern, spielt RLHF eine sehr wichtige Rolle, macht ChatGPT-Fehler jedoch subtiler und schwieriger zu erkennen.

Ein Artikel „LLM-Kritiker helfen beim Aufspüren von LLM-Fehlern„Das neue Papier beschreibt, dass OpenAI CriticGPT als neuen Assistenten für KI-Trainer entwickelt hat, der für die Überprüfung des von ChatGPT generierten Codes und das Aufzeigen von Fehlern verantwortlich ist und Menschen dabei hilft, Fehler zu finden, die möglicherweise übersehen wurden.“

Tatsächlich verwendet CriticGPT auch RLHF für das Training. Im Gegensatz zu ChatGPT haben OpenAI-Forscher jedoch absichtlich eine große Menge an Fehlercodedaten eingefügt, um CriticGPT beizubringen, verschiedene Codefehler zu identifizieren und zu markieren.

Openai Trained Criticgpt To Write Critiques That Highlight Inaccuracies In Chatgpt Answers

▲ CriticGPT findet Fehler im von ChatGPT generierten Code. (Quelle:OpenAI-Blog

OpenAI plant, CriticGPT-ähnliche Modelle in den RLHF-Annotationsprozess zu integrieren, um dem KI-Schulungspersonal klare Hilfestellung zu bieten. CriticGPT hilft OpenAI dabei, leistungsfähigere Modelle zu trainieren, um sicherzustellen, dass die generierten Inhalte vertrauenswürdig sind und den menschlichen Werten entsprechen.

Siehe auch  Unternehmer mit Migrationshintergrund sichern sich 100 Millionen US-Dollar für ChatGPT-Konkurrenten, die sich nichts einfallen lassen

(Quelle des ersten Bildes:Unsplash

Möchtest du uns einen Kaffee spendieren?

Symbol-Tag

65 Yuan pro Tasse Kaffee

Ihre Kaffeepatenschaft wird uns am Laufen halten

Der Gesamtbetrag beträgt NT$ 0 Yuan

„Fragen und Antworten zum Kaffeekauf“

Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein