Das KI-Unternehmen OpenAI hat „GPTBot“ auf den Markt gebracht, sein neues Web-Crawling-Tool, das seiner Meinung nach möglicherweise zur Verbesserung zukünftiger chatgpt-Modelle eingesetzt werden könnte.
„Mit dem GPTBot-Benutzeragenten gecrawlte Webseiten haben das Potenzial, zur Verbesserung zukünftiger Modelle genutzt zu werden“, heißt es in einem neuen OpenAI-Blogbeitrag und fügt hinzu, dass dies die Genauigkeit verbessern und zukünftige Iterationen ermöglichen könnte.
Ein Crawler, manchmal auch Web Spider genannt, ist eine Art Bot, der den Inhalt von Websites im Internet indiziert. Suchmaschinen wie google und Bing nutzen sie, um Websites in ihren Suchergebnissen anzuzeigen.
OpenAI sagte, der Webcrawler werde öffentliche Daten aus dem World Wide Web sammeln, aber Quellen herausfiltern, die kostenpflichtige Inhalte erfordern oder bekanntermaßen persönliche Daten sammeln oder Texte enthalten, die gegen seine Richtlinien verstoßen.
OpenAI has filed a trademark application for:
“GPT-5”
which includes “software for”:
“the artificial production of human speech and text”
“conversion of audio data files into text”
"voice and speech recognition"
"machine-learning based language and speech processing"
— YK aka CS Dojo 📺🐦 (@ykdojo) August 1, 2023
Beobachter möchten jedoch möglicherweise noch nicht den Atem anhalten, bis die nächste Version von ChatGPT erscheint. Im Juni sagte OpenAI-Gründer und CEO Sam Altman, das Unternehmen sei „noch lange nicht kurz davor“, mit dem GPT-5-Training zu beginnen, und erklärte, dass vor Beginn mehrere Sicherheitsüberprüfungen durchgeführt werden müssten.
Verwandte Themen: 11 ChatGPT-Tipps für Top-Leistung
Unterdessen wurden kürzlich Bedenken hinsichtlich der Datenerfassungstaktiken von OpenAI geäußert, insbesondere im Hinblick auf Urheberrecht und Einwilligung.
Japans Datenschutzbehörde warnte OpenAI im Juni davor, sensible Daten ohne Erlaubnis zu sammeln, während Italien die Verwendung von ChatGPT vorübergehend verbot, nachdem es im April Verstöße gegen verschiedene Datenschutzgesetze der Europäischen Union behauptet hatte.
Ende Juni reichten 16 Kläger eine Sammelklage gegen OpenAI ein und behaupteten, das KI-Unternehmen habe auf private Informationen aus ChatGPT-Benutzerinteraktionen zugegriffen.
Wenn diese Behauptungen zutreffen, würden OpenAI – und Microsoft, das als Beklagte genannt wurde – gegen den Computer Fraud and Abuse Act verstoßen, ein Gesetz mit Präzedenzfall für Web-Scraping-Fälle.