Im Gerichtssaal Die New York Times hat eine harte Linie gegen OpenAI eingeschlagen. Die Zeitung verklagt das Startup für künstliche Intelligenz zusammen mit Investor und Partner Microsoft und behauptet, OpenAI habe Artikel ohne Erlaubnis oder Entschädigung gescrapt. Die Times will OpenAI und Microsoft zur Verantwortung ziehen für Milliarden Dollar Schadenersatz.
Gleichzeitig greift die Times jedoch auch auf die generative KI-Technologie von OpenAI zurück.
Die Times will OpenAI und Microsoft für Milliardenschäden haftbar machen.
Der Einsatz dieser Technologie durch die Times kam dank durchgesickerter Codes ans Licht, aus denen hervorgeht, dass die Times ein Tool entwickelt hat, das mithilfe von OpenAI Überschriften für Artikel generiert und „bei der Anwendung des Styleguides der New York Times hilft“ – und damit Funktionen ausführt, die normalerweise von den Redakteuren der Zeitung ausgeführt werden, wenn sie in der Nachrichtenredaktion angewendet werden.
„Das Projekt, auf das Sie sich beziehen, war ein sehr frühes Experiment unseres Ingenieurteams, das darauf abzielte, generative KI und ihre potenziellen Anwendungsfälle zu verstehen“, sagte Times-Sprecher Charlie Stadtlander gegenüber The Intercept. „In diesem Fall ging das Experiment nicht über Tests hinaus und wurde von der Nachrichtenredaktion nicht verwendet. Wir experimentieren weiterhin mit potenziellen Anwendungen von KI zum Nutzen unserer Journalisten und unseres Publikums.“
Medien nutzen zunehmend künstliche Intelligenz, um verschiedene Aufgaben zu bewältigen. Dabei kommen große Sprachmodelle zum Einsatz, die durch die Aufnahme von Text lernen und dann Sprache generieren. KI kann beispielsweise eingesetzt werden, um große Datensätze zu sortieren.
Der Einsatz von KI in stärkerem Maße in der Öffentlichkeit hat mitunter zu peinlichen Situationen geführt. Sport illustriert löschte Beiträge auf seiner Website, nachdem seine Leser aufgedeckt hatten, dass einige seiner Autoren von KI generiert wurden. Die britische Boulevardzeitung Daily Mail veröffentlichte einen KI-Artikel, in dem eine Satire von Saturday Night Live als echte Nachricht ausgegeben wurde.
Einige KI-Anwendungen in Redaktionen sind verstohlen, aber in manchen Fällen machen die Medien ihre KI-Arbeit öffentlich. Newsweek beispielsweise kündigte eine umfangreiche, wenn auch nebulöse umarmen der KI.
Wie andere Medien auch, ist die Times nicht zurückhaltend, was den Einsatz von KI angeht. Die Website der Zeitung Forschung und Entwicklung Team sagt„Künstliche Intelligenz und Journalismus überschneiden sich in unserer Berichterstattung, Redaktion und Interaktion mit den Lesern.“ Auf der Website der Times werden 24 Anwendungsfälle von KI im Unternehmen hervorgehoben; der Style Guide und das Headline-Projekt sind darin nicht aufgeführt.
Wegen ihrer rekuperativen Arbeitsweise stehen viele der KI in Redaktionen skeptisch gegenüber. Während die Medienbranche Arbeitsplätze abbaut – im Jahr 2023 gingen mehr als 20.000 Stellen verloren – gibt es auch Befürchtungen, dass KI Journalisten noch mehr Arbeitsplätze wegnehmen könnte. Im Jahr 2017 schrieb die Times eliminiert seine Redaktion, bei der einige Redakteure andere Rollen übernehmen. Die Redaktion war zuvor für die Durchsetzung des Stilleitfadens verantwortlich, eine der Aufgaben, die die Publikation mithilfe künstlicher Intelligenz getestet hat.
Der Times-Code wurde letzten Monat öffentlich, als ein anonymer Benutzer auf dem 4chan-Bulletin-Board Gesendet ein Link zu einer Sammlung von Tausenden von GitHub-Repositories der New York Times, im Wesentlichen eine Speicherung von Codesammlungen für kollaborative Zwecke. In einer Textdatei im Leak heißt es, das Material stelle einen „mehr oder weniger vollständigen Klon aller Repositories der New York Times auf GitHub“ dar.
Die Times bestätigte die Echtheit des Lecks in einem Stellungnahme gegenüber BleepingComputer und sagte, der Code sei im Januar „versehentlich verfügbar gemacht“ worden.
Das Leck enthält mehr als 6.000 Repositorien mit insgesamt mehr als 3 Millionen Dateien. Es handelt sich um eine umfangreiche Sammlung von Materialien, die die technische Seite der Times abdecken, aber aus der Nachrichtenredaktion oder der Geschäftsseite des Unternehmens scheint das Leck nur wenig zu enthalten.
Die Times hat 1 Million US-Dollar zu seiner Klage wegen angeblicher Urheberrechtsverletzung gegen OpenAI und Microsoft. The Intercept ist in einen gesonderten Rechtsstreit verwickelt gegen OpenAI und Microsoft gemäß dem Digital Millennium Copyright Act.
„Nicht improvisieren“
Eines der KI-Projekte der New York Times mit dem Titel „OpenAI Styleguide“ wird in der Begleitdokumentation als „Prototyp beschrieben, der OpenAI zur Anwendung des New York Times-Styleguides verwendet.“ Das Projekt enthält auch einen Überschriftengenerator.
Der Styleguide-Checker verwendet ein OpenAI-Sprachmodell namens Davinci, um alle Fehler in Überschrift, Autorenzeile, Datumszeile oder Kopie – also dem Text des Artikels – eines Artikels zu korrigieren, die gegen den Styleguide der Times verstoßen. Die Eingabeaufforderung sagt dem OpenAI-Bot: „Improvisieren Sie nicht. Verwenden Sie keine Regeln, die Sie woanders gelernt haben.“
Eine Kopie des Styleguides der Times befindet sich in einem separaten Repository, das auch im Leak verfügbar ist.
Die Überschriftengenerator-Komponente des Projekts teilt OpenAI mit: „Sie sind ein Überschriftenschreiber [sic] für die New York Times. Verwenden Sie den folgenden Artikel als Kontext. Verwenden Sie kein Vorwissen.“ Der Generator ermöglicht es dem Betreiber auch, verschiedene Einschränkungen festzulegen, z. B. anzugeben, welche Wörter verwendet werden dürfen und welche nicht.
„Erstellen Sie eine nummerierte Liste mit drei nüchternen, anspruchsvollen und klaren Schlagzeilen basierend auf den ersten drei Absätzen der folgenden Geschichte.“
Das OpenAI Styleguide-Projekt ist nicht das einzige Beispiel, bei dem die Times mit der Verwendung von OpenAI zur Schlagzeilengenerierung experimentiert hat. Ein anderes Repository enthält ein separates Projekt zur Schlagzeilengenerierung unter Verwendung eines OpenAI-Chatbots namens chatgpt. Das Projekt war Teil eines Maker-Woche bei der Times, wo die Mitarbeiter an „selbstgesteuerten Projekten“ arbeiten. Der Schlagzeilengenerator von Maker Week sagt dem Bot: „Generiere eine nummerierte Liste mit drei nüchternen, anspruchsvollen, klaren Schlagzeilen basierend auf den ersten drei Absätzen der folgenden Geschichte.“
Ein weiteres Maker Week-Projekt, das OpenAI-Tools verwendet, ist „Counterpoint“, beschrieben als „Anwendung, die Gegenargumente zu Meinungsartikeln generiert“. Das Projekt scheint noch nicht abgeschlossen zu sein und weist den Bot lediglich an, Schlüsselwörter aus einem Artikel zu extrahieren.
Neben dem OpenAI Styleguide enthält das Times-Github-Leck auch Quellcode für verschiedene Anwendungen. Einige davon sind Forschungsprojekte – „ein Versuch, ein Vorhersagemodell für den Rückgang von Printabonnements zu entwickeln“ – und andere decken Dinge wie technische Testfragen für Vorstellungsgespräche, Schulungsmaterialien für Mitarbeiter, Authentifizierungsdaten, Prototypen für unveröffentlichte Spiele und verschiedene persönliche Informationen ab.