CriticGPT wird es ermöglichen, künstliche Intelligenz besser zu überwachen und besser zu korrigieren. Seine Aufgabe besteht darin, chatgpt-Fehler zu melden.
OpenAI hat letzte Woche sein neues Modell für künstliche Intelligenz vorgestellt. Dadurch gelingt es, Fehler im Code zu identifizieren, den ChatGPT generieren kann. Das kalifornische Start-up hat entworfen KritikerGPT um die Ergebnisse zu verbessern und die Genauigkeit seines beliebten generativen Chatbots zu verfeinern.
IchVerstärkungslernen aus menschlichem Feedback (RLHF) stellt einen entscheidenden Prozess in der Entwicklung künstlicher Intelligenz dar.
Es ist tatsächlich diese Technik, die die Verbesserung der Ergebnisse und der Präzision großer Sprachmodelle (LLM) ermöglicht. Das neue OpenAI-Tool macht es einfacher, dies zu erreichen.
CriticGPT unterstützt Entwickler dabei Überprüfung des Programmiercodes. Forscher des kalifornischen Start-ups beschreiben ihre Arbeit in diesem Artikel.
Einen automatischen Kritiker trainieren
Die aktuellen Fähigkeiten von ChatGPT basieren auf GPT-4 und seine anderen Versionen. Denken Sie daran, dass das hauseigene LLM des kalifornischen Start-ups in verfügbar ist GPT-4 Turbo und GPT-4o.
Auch CriticGPT greift auf diese Familie großer Sprachmodelle zurück. Es erleichtert die Arbeit der Entwickler durch die Leistung Code-Analyse gießen mögliche Fehler melden. Diese können der menschlichen Aufmerksamkeit entgehen.
Es wurde mithilfe eines Datensatzes von Codebeispielen trainiert. Diese Proben enthielten absichtlich eingefügte Fehler.
Anschließend gaben die Entwickler Feedback, als ob sie die Fehler entdeckt hätten. Dank dieser Methode war die KI in der Lage verschiedene Codierungsfehler erkennen und melden.
Drei von fünf Entwicklern bevorzugen bereits CriticGPT
Die Entwicklung von CriticGPT erforderte eine neue Technik namens Force Sampling Strahlsuche (FSBS). Dadurch kann der Chatbot sehr detaillierte Berichte schreiben.
Die Methode bietet auch die Möglichkeit, die Genauigkeit anzupassen, mit der der Chatbot nach Fehlern sucht. Darüber hinaus steuert es, wie oft falsch positive Ergebnisse generiert werden. Daher ist es weniger umwerfend als ChatGPT.
CriticGPT hat seine Fähigkeit unter Beweis gestellt Erkennen Sie sowohl absichtliche als auch natürliche Fehler in ChatGPT-Ergebnissen. Entwickler scheinen diesen neuen Assistenten der künstlichen Intelligenz bereits sehr zu schätzen.
In der Tat, in 63 % der Fälle handelt es sich um natürliche Fehler, bevorzugten sie das Feedback des Chatbots gegenüber dem anderer Entwickler. Dies führte zu umfassenderen Rezensionen.
Über die Codeüberprüfung hinaus
CriticGPT zeichnet sich nicht nur durch die Codeüberprüfung aus, sondern auch durch Auswertung von Trainingsdaten. Bei Sätzen, die für ChatGPT bestimmt waren, fand das neue Tool Fehler – die unter der Aufsicht der Entwickler weitergegeben wurden 24 % der Fälle.
Diese Fähigkeit, Fehler zu erkennen, die Menschen oft übersehen, deutet darauf hin, dass sie über die Codierung hinaus nützlich ist. Allerdings hat diese neue KI ihre Grenzen.
Sie war auf kurze Antworten trainiert und hat das vielleicht auch getan Schwierigkeiten mit längeren, komplexeren Aufgaben haben. Seine Fähigkeit, Halluzinationen zu reduzieren, ist beeindruckend, beseitigt sie jedoch nicht vollständig.
Ungeachtet dessen plant OpenAI, CriticGPT in seinen RLHF-Prozess zu integrieren, um die Auswertung seiner LLM-Ergebnisse zu verbessern.
Glauben Sie, dass diese KI bald für Abonnenten zugänglich sein wird?
- Teilen Sie den Artikel:
Unser Blog wird von Lesern betrieben. Wenn Sie über Links auf unserer Website einkaufen, verdienen wir möglicherweise eine Affiliate-Provision.