- Für Entwickler ist Stack Overflow eine wichtige Ressource.
- Im Laufe der Jahre hat ihnen die Q&A-Plattform dabei geholfen, die Höhen und Tiefen der Programmierung zu bewältigen.
- Nun werden Bedenken geäußert, nachdem OpenAI eine Vereinbarung getroffen hat, seine Daten zum Trainieren von ChatGPT zu nutzen.
Sie können darauf wetten, dass sich die meisten Entwickler irgendwann in ihrer Karriere an Stack Overflow gewandt haben.
Seit 2008 dient die Website als nahezu unverzichtbare Frage-und-Antwort-Quelle für Techniker, die Lösungen für Programmierprobleme finden, ihre Arbeitskenntnisse verbessern oder einfach mit anderen in der Softwarebranche in Kontakt treten möchten.
Laut Stack Overflow wird auf der Website durchschnittlich alle 14 Sekunden eine neue Frage gestellt, wobei bisher fast 60 Millionen Fragen und Antworten gezählt wurden. Im Jahr 2021 wurde das Unternehmen von der europäischen Investmentgruppe Prosus für 1,8 Milliarden US-Dollar übernommen.
Das macht es zu einer Ressource von großem Wert – und zu einer Ressource, die Entwickler verständlicherweise gerne schützen würden.
Es ist vielleicht keine Überraschung, dass einige Stack Overflow-Benutzer angefangen haben, Aufruhr zu machen, nachdem die Fülle an Informationen, die sie im Laufe der Jahre zur Website beigetragen haben, gerade zum Ziel eines datenhungrigen Unternehmens geworden ist: OpenAI.
OpenAI-Deal löst Kontroversen aus
Am Montag der ChatGPT-Hersteller und Stack Overflow gab eine Partnerschaft bekannt um OpenAI-Benutzern und ihren Kunden „die genaue und geprüfte Datengrundlage zu bieten, die KI-Tools benötigen“, um ihre Probleme zu lösen.
OpenAI stellte fest, dass es „validiertes technisches Wissen von Stack Overflow direkt in ChatGPT sichtbar machen“ würde, um Benutzern „einfachen Zugriff auf vertrauenswürdiges, zugeschriebenes, genaues und hochtechnisches Wissen und Code zu ermöglichen, der von Millionen von Entwicklern unterstützt wird“ auf dem fast 16-Jährigen Website.
Für OpenAI ist der Deal eine Selbstverständlichkeit.
Seine KI-Modelle wie GPT-4 profitieren enorm, wenn sie auf möglichst vielen Daten trainiert werden. Wenn die Modelle auf hochtechnische, spezielle Daten wie die von Stack Overflow trainiert werden, reagieren sie besser auf die Eingabeaufforderungen der ChatGPT-Benutzer.
Auch Stack Overflow möchte von der Partnerschaft profitieren, indem es die Modelle von OpenAI bei der Entwicklung von nutzt OverflowAI. Das im Juli 2023 vorgestellte Produkt war der Versuch des Unternehmens, generative KI-Funktionen in seine Dienste zu integrieren.
Einige Entwickler, die sich für Stack Overflow einsetzen, haben jedoch begonnen, ihrem Frust Luft zu machen.
Auf Mastodon, einem Open-Source-Social-Media-Dienst, ein Stack Overflow-Benutzer teilten mit, dass sie versucht hätten, ihre „am höchsten bewerteten Antworten“ auf der Website zu löschen, um gegen den Deal mit OpenAI zu protestieren.
„Mit Stack Overflow können Sie keine Fragen löschen, die Antworten und viele Upvotes haben, da dadurch Wissen aus der Community entfernt würde“, schrieb der Benutzer namens Ben. „Stattdessen habe ich meine am höchsten bewerteten Antworten in eine Protestnachricht geändert.“
Innerhalb einer Stunde teilte der Benutzer mit, dass sein Versuch, seine am höchsten bewerteten Antworten zu ändern, rückgängig gemacht worden sei und sein Konto anschließend für sieben Tage gesperrt worden sei.
Auf einem von Ben geteilten Screenshot der Antwort von Stack Overflow heißt es: „Sie haben kürzlich Inhalte aus Ihren Beiträgen entfernt oder unkenntlich gemacht. Bitte beachten Sie, dass diese Beiträge, sobald Sie eine Frage oder Antwort auf dieser Website posten, Teil der kollektiven Bemühungen anderer werden.“ haben auch zu diesem Inhalt beigetragen.“
Ben fuhr auf Mastodon fort und deutete an, dass dies „eine Erinnerung daran sei, dass alles, was Sie auf einer dieser Plattformen posten, gewinnbringend verwendet werden kann und wird“, und dass „es nur eine Frage der Zeit ist, bis alle Ihre Nachrichten auf Discord, Twitter usw. verfügbar sind.“ geschabt, in ein Modell eingespeist und an Sie zurückverkauft.“
Mittlerweile am Stack Overflow-Benutzerforumfragte ein anderer Benutzer aus Europa: „Wo ist die Opt-out-Option, damit meine Antworten nicht von OpenAI verwendet werden?“ Gleichzeitig stellt sich die Frage, ob die Datenschutzbestimmungen der Europäischen Union es ihnen erlauben würden, ihre Antworten von der Website zu entfernen.
Auch die Nutzer äußerten sich zu dem Deal für X.
Emily BenderProfessor an der University of Washington, kritisierte die Partnerschaft am Donnerstag und schrieb: „Ich möchte die Welt daran erinnern, dass man sich mit OpenAI eigentlich nicht abfinden muss. StackOverflow war ein Leuchtfeuer des Widerstands, aber ich denke, ihre Prinzipien.“ standen doch zum Verkauf.“
In einem Beitrag vom Mittwoch schrieb Gergely Orosz, Autor von Der pragmatische Ingenieur Newsletter, schrieb: „Wie reagieren Sie als Entwickler, wenn Sie erkennen, dass Ihre Bemühungen, anderen Entwicklern bei ihren Problemen zu helfen (durch die Beantwortung von Fragen auf StackOverflow), jetzt eine Möglichkeit für StackOverflow sind, diese Daten für OpenAI zu verkaufen, um ChatGPT zu einer besseren Leistung zu trainieren?“ ?“
Stack Overflow reagierte nicht auf eine Anfrage nach einem Kommentar.
Es ist klar, dass die Leute über diesen Deal verärgert sind, aber es ist erwähnenswert, dass es nicht das erste Mal ist, dass die Verwendung von Daten anderer durch OpenAI Anlass zur Sorge gibt.
Das Unternehmen sieht sich mehreren Klagen von Urhebern wie Künstlern und Autoren gegenüber, die behaupten, OpenAI nutze ihre Werke ohne Erlaubnis, um Gewinn zu erzielen.
Da Stack Overflow und OpenAI nun öffentlich zusammenarbeiten, müssen Entwickler überlegen, wie gut sie mit der Nutzung ihrer Erkenntnisse durch ChatGPT vertraut sind.
Axel Springer, die Muttergesellschaft von Business Insider, hat einen globalen Vertrag abgeschlossen, der es OpenAI ermöglicht, seine Modelle auf die Berichterstattung seiner Medienmarken zu trainieren.
Axel Springer, die Muttergesellschaft von Business Insider, hat einen globalen Vertrag abgeschlossen, der es OpenAI ermöglicht, seine Modelle auf die Berichterstattung seiner Medienmarken zu trainieren.