Start ChatGPT ChatGPT von OpenAI formatiert jetzt die Ausgabe für Entwicklerabfragen

ChatGPT von OpenAI formatiert jetzt die Ausgabe für Entwicklerabfragen

Von

Nina Weber

August 7, 2024

Glücklich hide

1 Wie strukturierte Ergebnisse die Qualität des LLM verbessern

2 So erstellen Sie strukturierte Ausgaben

OpenAI, das Unternehmen hinter dem beliebten chatgpt Large Language Model Generative AI-Dienst, hat ein Tool veröffentlicht, das Abfrageergebnisse im exakt vom Benutzer angegebenen Format zurückgibt.

Dies war die am häufigsten gestellte Anfrage unter Entwicklern, die die KI-Technologie nutzen. nach an den OpenAI-CEO Sam Altman.

Seit seinem Debüt im November 2022 wurde der ChatGPT-Dienst von unzähligen Anwendungsentwicklern für agentengesteuerte und andere Apps genutzt. Aber während ChatGPT Unmengen unstrukturierter Daten nutzt, um seine Ergebnisse zu liefern (über API-gesteuerte Funktionsaufruf) würden Anwendungsentwickler diese Ergebnisse viel lieber als strukturierte Daten erhalten, damit sie von ihren jeweiligen Apps besser analysiert werden können.

Im letzten Jahr erweiterte OpenAI seine API um Ergebnisse aus JSON. Diese Woche geht das Unternehmen noch einen Schritt weiter und stellt eine neue API-Funktion vor: Strukturierte Ausgabendas die Ergebnisse in dem JSON-Schema liefert, das der Entwickler in der Abfrage angibt.

„Entwickler arbeiten schon lange an den Einschränkungen von LLMs […] über Open-Source-Tools, indem Anfragen wiederholt abgefragt und wiederholt werden, um sicherzustellen, dass die Modellausgaben den für die Interoperabilität mit ihren Systemen erforderlichen Formaten entsprechen“, schrieb Michelle Pokrass, OpenAI technischer Mitarbeiter, in einer Blogeintrag gepostet am Dienstag.

„Structured Outputs löst dieses Problem, indem es OpenAI-Modelle so einschränkt, dass sie den vom Entwickler bereitgestellten Schemata entsprechen, und indem es unsere Modelle trainiert, komplizierte Schemata besser zu verstehen.“

Wie strukturierte Ergebnisse die Qualität des LLM verbessern

Strukturierte Ausgaben unterscheiden sich von den durch einfache Benutzereingaben generierten Ausgaben dadurch, dass sie hinsichtlich der Informationen, die sie bereitstellen können, eingeschränkt sind. Diese Technik wird als „eingeschränktes Sampling“ oder „eingeschränktes Decodieren“ bezeichnet.

Siehe auch OpenAI transkribiert über eine Million Stunden YouTube-Video, um ChatGPT zu trainieren

„Um gültige Ausgaben zu erzwingen, beschränken wir unsere Modelle auf nur die Token, die gemäß dem bereitgestellten Schema gültig wären, und nicht auf alle verfügbaren Token“, erklärte Pokrass.

Für ChatGPT verbessert dieser zusätzliche Schritt des Ausfüllens des Schemas dessen Genauigkeit.

Die OpenAI-Entwickler stellten in Tests fest, dass ChgatGPT ein vordefiniertes Schema in 100 % der Fälle korrekt ausfüllen konnte, aber nur in 85 % der Fälle über einfache Eingabeaufforderungen die richtigen Antworten lieferte.

OpenAI-Diagramm, das die Zuverlässigkeit der für JSON-Schemas generierten ChatGPT-Antworten mit denen vergleicht, die von der Eingabeaufforderung generiert werden.

So erstellen Sie strukturierte Ausgaben

Wenn ihre Apps jetzt eine Anfrage stellen, liefern die Entwickler ein JSON-Schema über json_schemaeine neue Option für die Antwortformat Parameter. Der strikt Der Wert muss innerhalb der Funktionsdefinition auf „true“ gesetzt werden. Die Ausgabe des Modells würde dann seine Antworten am besten mit dem Schema abstimmen (das funktioniert sowohl für KI-Tools als auch für direkte Benutzeranfragen).

Die Antworten werden weiterhin den Anforderungen von OpenAI entsprechen. Sicherheitsanforderungen — das potenziell schädliche Inhalte blockiert — und gibt eine Ablehnung Zeichenfolgenwert auf Fragen, die es nicht beantwortet. Und es gibt noch weitere Einschränkungen: Es unterstützt nur eine Teilmenge der JSON-Schema. Fehler bei der Modelldefinition werden dadurch nicht verhindert und es kommt zu einer zusätzlichen Verzögerung bei der ersten Antwort, da ChatGPT das Schema des Entwicklers sortiert.

Sowohl die Node.js- als auch die Python-Softwareentwicklungskits von OpenAI wurden mit dem neuen aktualisiert Antwortformat Parameter.

Der größte mögliche Anwendungsfall ist natürlich die Formatierung unstrukturierter Daten in strukturierte Daten, sodass sie von einem relationalen Datenbanksystem aufgenommen und analysiert werden können. Dies war lange Zeit eine Herausforderung für Organisationen, die große Mengen an Informationen in Office-Dokumenten gespeichert hatten.

Siehe auch ChatGPT wird über eine Speicherfunktion verfügen, die sich an Ihre vergangenen Chat-Inhalte und bestimmte Dinge erinnern kann (die kostenlose Version kann auch verwendet werden) – Computer King Ada

Pokrass erläutert jedoch einige mögliche erweiterte Einsatzmöglichkeiten der Technologie, darunter die Erstellung von Benutzeroberflächen im laufenden Betrieb auf der Grundlage von Benutzereingaben und die Bereitstellung einer einzigen Antwort ohne unterstützendes Material.

Dies sei eine „großartige und dringend benötigte Funktion“, sagt der Forscher für maschinelles Lernen Elvis Saravia bemerkt auf X. Saravia hat ein Tutorial für YouTube erstellt, in dem es um die Verwendung strukturierter Ausgaben geht:

YOUTUBE.COM/THENEWSTACK

Die Technik entwickelt sich schnell, verpassen Sie keine Folge. Abonnieren Sie unseren YouTube-Kanal, um alle unsere Podcasts, Interviews, Demos und mehr zu streamen.

Joab Jackson ist leitender Redakteur bei The New Stack und befasst sich mit Cloud Native Computing und Systembetrieb. Er berichtet seit über 25 Jahren über IT-Infrastruktur und -Entwicklung, unter anderem bei IDG und Government Computer News. Davor war er…

Lesen Sie mehr von Joab Jackson

5/5 - (318 votes)

Wie strukturierte Ergebnisse die Qualität des LLM verbessern

So erstellen Sie strukturierte Ausgaben

Kommentieren Sie den Artikel Antwort abbrechen

So verhindern Sie, dass Chrome oder Edge den Browserverlauf und Daten speichern

Der Black Adam-Synchronsprecher von MultiVersus war in Dragon Ball Z und One Piece zu...

Wie strukturierte Ergebnisse die Qualität des LLM verbessern

So erstellen Sie strukturierte Ausgaben

Verwandte ArtikelMehr vom Autor

Das ChatGPT Hong Kong-Tutorial zeigt Ihnen Schritt für Schritt, wie Sie sich kostenlos registrieren, wie Sie es verwenden und wie Sie das Abonnement bezahlen

ChatGPT erklärte, was mit dem Hamster Kombat-Whitepaper nicht stimmt

Sparen Sie 80 % auf dieses AI Super Skills Bundle feat. ChatGPT, Leonardo, Midjourney und mehr

Kommentieren Sie den Artikel Antwort abbrechen

So verhindern Sie, dass Chrome oder Edge den Browserverlauf und Daten speichern

Der Black Adam-Synchronsprecher von MultiVersus war in Dragon Ball Z und One Piece zu...

Verwandte Artikel Mehr vom Autor