Um den Nutzen generativer KI-Tools für Entwickler zu erhöhen, hat OpenAI CriticGPT eingeführt, ein neues Modell, das bei der Identifizierung von Fehlern in chatgpt-Codeausgaben helfen soll.

Basierend auf GPT-4 behauptet OpenAI, dass CriticGPT in 60 % der Fälle in der Lage war, die Leistung von eigenständigen Versuchen zu übertreffen, was seine Fähigkeit zeigt, die menschliche Leistung bei Codeüberprüfungsaufgaben zu verbessern, anstatt menschliche Arbeitskräfte zu ersetzen.

Die Initiative von OpenAI zielt darauf ab, den Prozess des „Reinforcement Learning from Human Feedback“ (RLHF) zu verfeinern, um eine höhere Qualität und größere Zuverlässigkeit von KI-Systemen zu gewährleisten.

OpenAI führt neues Code-Prüfungsmodell ein

Die neueste GPT-4-Serie von OpenAI, die öffentlich verfügbare Versionen von ChatGPT antreibt, verlässt sich stark auf RLHF, um sicherzustellen, dass ihre Ausgaben sowohl zuverlässig als auch interaktiv sind. Bisher war dieser Prozess manuell und stützte sich auf die menschliche Leistung von KI-Trainern, die ChatGPT-Antworten bewerteten, um die Leistung des Modells zu verbessern.

Mit der Einführung von CriticGPT kann OpenAI die Antworten von ChatGPT nun selbstständig kritisieren, was Bedenken ausräumt, dass der KI-Chatbot für viele menschliche Trainer zu anspruchsvoll sein könnte.

CriticGPT wurde von Trainern trainiert, die Feedback gaben, nachdem sie absichtlich Fehler in den von ChatGPT generierten Code eingefügt hatten. Die Ergebnisse waren vielversprechend: Die Kritiken von CriticGPT wurden von den Trainern in etwa zwei Dritteln (63 %) der Fälle bevorzugt, da das Tool Kleinigkeiten und Halluzinationen reduzieren kann.

Allerdings weist das Projekt auch seine Grenzen auf und die Zusammenarbeit zwischen KI und Mensch erweist sich nach wie vor als effektiver als die alleinige Nutzung von KI.

In seinem BekanntmachungOpenAI fasste zusammen: „Die Vorschläge von CriticGPT sind nicht immer richtig, aber wir stellen fest, dass sie Trainern helfen können, mit modellbasierten Antworten viel mehr Probleme zu erkennen, als dies ohne die Hilfe der KI möglich wäre.“

Das Unternehmen räumte außerdem ein, dass „Fehler sich über mehrere Teile einer Antwort erstrecken können“, was es für ein KI-Tool schwieriger macht, die Ursache zu identifizieren.

Mit Blick auf die Zukunft hat OpenAI Pläne bestätigt, seine Arbeit an CriticGPT auszuweiten und in die Praxis umzusetzen.

Mehr von TechRadar Pro

5/5 - (163 votes)
Anzeige
Nina Weber
Nina Weber is a renowned Journalist, who worked for many German Newspaper's Tech coloumns like Die Zukunft, Handelsblatt. She is a contributing Journalist for futuriq.de. She works as a editor also as a fact checker for futuriq.de. Her Bachelor degree in Humanties with Major in Digital Anthropology gave her a solid background for journalism. Know more about her here.

Kommentieren Sie den Artikel

Bitte geben Sie Ihren Kommentar ein!
Bitte geben Sie hier Ihren Namen ein