Für Eco: Warum haben Sie sich für die Arbeit an diesem Thema entschieden?
Schüttelte Noy. Künstliche Intelligenz war zunächst kein Bereich, der mich besonders interessierte. Doch als chatgpt Ende November letzten Jahres startete, wurde ganz klar, dass gerade etwas völlig Neues und Andersartiges als alles, was es zuvor gab, geboren wurde. Und wenn diese Neuheit erst in den Kinderschuhen stecke und künftige Verbesserungen verspricht, dann hätte sie zweifellos erhebliche Auswirkungen auf die Arbeitsmärkte, auf die Produktion … kurz gesagt, auf die Welt. Das ist es, was uns wirklich motiviert hat: die Bedeutung der Frage und der Technologie.
Von dort aus haben wir uns die grundlegenden Fragen gestellt, die sich Ökonomen normalerweise stellen, wenn sie über die Folgen des Aufkommens neuer Technologien auf die Arbeitswelt nachdenken: Wie wirken sie sich auf die durchschnittliche Produktivität aus, wie wirken sie sich auf die Ungleichheiten zwischen verschiedenen Arten von Arbeitnehmern aus …
Die Frage der Produktivität ist für Ökonomen zentral. Der Steigerung der Produktivität verdanken wir den gesamten wirtschaftlichen Wohlstand und Lebenskomfort in der heutigen Welt. Produktivitätssteigerungen sind der Motor des Wirtschaftswachstums und der Verbesserung unserer Lebensbedingungen. Wenn ein Tool sie also deutlich steigern würde … Das hätte immense Konsequenzen.
Lesen Sie auch > Produktivität. Werden KI und ChatGPT das Solow-Paradoxon obsolet machen?
Von da an wollten wir ein relativ schnelles, bahnbrechendes Experiment durchführen. Aus diesem Grund haben wir uns für die Durchführung eines randomisierten Online-Experiments entschieden, das am einfachsten einzurichten ist. Wir haben im Dezember 2022 mit der Arbeit daran begonnen. Wir haben das Experiment im Januar und Februar durchgeführt, dann haben wir den Artikel geschrieben. Anfang März haben wir eine vorläufige Version unseres Artikels veröffentlicht (a Vordruck). Wir haben es dann bei der Zeitschrift eingereicht Wissenschaft etwa Mitte März. Schließlich wurde unser Artikel nach einem relativ normalen Prozess des Austauschs und Hin und Hers mit den Herausgebern, professionellen Experten auf diesem Gebiet, um bestimmte Details zu verbessern, im Juli in seiner endgültigen Fassung veröffentlicht.
Wofür Wissenschaft und kein Wirtschaftsbericht?
Aus mehreren Gründen. Erstens, Wissenschaft ist eine allgemeinere Zeitschrift, die nicht nur von Wirtschaftswissenschaftlern gelesen wird. Sie veröffentlichen einige sozialwissenschaftliche Artikel, jedoch nur zu wichtigen Themen, die für ein breites Publikum von Interesse sind. Der andere Grund war das Format unseres Forschungsartikels: Er war kürzer und einfacher als die Norm der in Wirtschaftszeitschriften veröffentlichten Artikel. Da wir uns also mit einem Thema befassen, dem größte Aufmerksamkeit geschenkt wurde, und das technisch gesehen relativ einfach ist, Wissenschaft passte perfekt zu uns, um die Reichweite und Leserschaft unserer Forschung zu maximieren.
Welche Erfahrungen haben Sie umgesetzt?
Wir haben ein randomisiertes Laborexperiment mit einer Testgruppe und einer Kontrollgruppe durchgeführt, eine in den Sozialwissenschaften sehr verbreitete Methode, die sehr nützlich ist, um einen kausalen Effekt zu identifizieren. Hätten wir in unserem Fall beispielsweise einfach nur die durchschnittliche Entwicklung der Produktivität im Zeitverlauf nach der Einführung von ChatGPT betrachtet, hätten wir daraus nicht viel ziehen können. Andere Elemente in der Arbeitswelt könnten sich gleichzeitig mit der Einführung von ChatGPT auf die Produktivität auswirken, beispielsweise Telearbeit.
Was wir also wollten, war eine kontrollierte Umgebung, in der der einzige Unterschied zwischen zwei Gruppen darin bestand, ob sie Zugriff auf ChatGPT hatten oder nicht. Wir rekrutierten eine ausreichend große Gruppe von Leuten und wählten sie dann zufällig in zwei Personen aus, die genau die gleiche Schreibaufgabe zu erledigen hatten. Und in diesem Fall ist jeder Unterschied in den Ergebnissen der beiden Gruppen nur auf den Zugriff auf das Tool zurückzuführen oder nicht.
Welche Annahmen hatten Sie vor dem Experiment und übertrafen die Ergebnisse Ihre Erwartungen?
Wir erwarteten Produktivitätssteigerungen, jedoch nicht in dieser Größenordnung (rund 40 %). Aus einem einfachen Grund: Die Teilnehmer des Experiments haben die Textproduktion von ChatGPT viel stärker verändert, als wir uns vorgestellt hatten. Wir dachten, sie würden ChatGPT verwenden, um einen ersten Entwurf zu erstellen und ihn anschließend zu bearbeiten.
Aber die meisten Leute nahmen einfach den ersten Entwurf und reichten ihn direkt ein: So erledigten sie die Aufgaben viel schneller als erwartet! Aber seien Sie vorsichtig, es war keine Faulheit ihrerseits: Die Realität ist, dass die von ChatGPT produzierte Qualität sehr gut war und viel besser als erwartet. Wir haben Experten angeworben, um die Renderings der Teilnehmer zu analysieren, und sie konnten bei denen, die mehr Zeit mit der Bearbeitung des KI-Renderings verbrachten, keine höhere Qualität feststellen.
Lesen Sie auch > Die lange Geschichte der Produktivitätssteigerungen
Ein weiteres überraschendes und grundlegendes Element betrifft die Produktivität verschiedener Arbeitnehmer. Historisch gesehen kamen hochqualifizierte Arbeitskräfte von vielen technologischen Fortschritten wie beispielsweise Computern mehr zugute als weniger qualifizierten Arbeitskräften. Aber bei ChatGPT ist das Gegenteil der Fall: Es sind die am wenigsten kompetenten Arbeitnehmer, die am meisten vom Zugang zu dieser Technologie profitiert haben: dem ToolWirkt als Fähigkeitsausgleich!
Andere ähnliche Studien scheinen diesen Trend zu bestätigen. Und die Folgen könnten erheblich sein: KI könnte letztlich die Gehaltsunterschiede zwischen manuellen und intellektuellen Berufen verringern. Ein Großteil der manuellen Arbeit, die automatisiert werden könnte, wie etwa bei Montagelinien, ist wahrscheinlich bereits weitgehend automatisiert. Die verbleibenden manuellen Arbeiten, wie zum Beispiel der Bau, lassen sich nur sehr schwer automatisieren. Und wir sind uns bewusst, dass es viel einfacher ist, eine KI zu entwerfen, die sehr gut schreibt, als Maurerroboter.
Lesen Sie auch > Hollywood, künstliche Intelligenz und die Angst vor Automatisierung bei Drehbuchautoren und Schauspielern
Was sind die größten Einschränkungen Ihrer Erfahrung?
Die größte Einschränkung der Studie besteht darin, dass die Aufgaben sehr künstlich waren. Dabei handelte es sich um eher allgemeine Schreibübungen von mittlerer Größe, die beispielsweise keine detaillierten Kenntnisse der Prozesse eines Unternehmens erforderten, kurz gesagt, was ChatGPT auszeichnet. Es ist sehr wahrscheinlich, dass bei realistischeren Aufgaben, die beispielsweise sachliche Genauigkeit erfordern, die Produktivitätsgewinne zumindest im aktuellen Zustand des Tools geringer ausfallen würden. Darüber hinaus besteht der offensichtliche nächste Schritt für die akademische Forschung darin, die Auswirkungen dieser Technologien in realeren Kontexten zu untersuchen.
Wie haben die Teilnehmer auf das Tool reagiert? Hatten sie Angst um ihren Arbeitsplatz?
Als wir das Experiment im Januar durchführten, war die Mehrheit der Teilnehmer neu bei ChatGPT. Sie waren beeindruckt und wir beobachteten zwei Konsequenzen. Einerseits hatten diejenigen, die Zugriff auf das Tool hatten, mehr Angst, durch KI ersetzt zu werden als die anderen. Aber sie waren auch begeisterter, dass es ihnen bei ihrer Arbeit helfen könnte. Und diese letzte Reaktion war am weitesten verbreitet. Das bedeutet schließlich nicht, dass dies immer so sein wird.
Die Ergebnisse unserer Studie können auf zwei Arten interpretiert werden, und es ist nicht klar, welche zum jetzigen Zeitpunkt relevanter ist. Die erste Interpretation ist, dass diese Technologie die Produktivität der Arbeitnehmer erheblich steigern und ihnen bei ihrer Arbeit erheblich helfen wird. Zweitens führt es die Aufgaben nicht zusätzlich, sondern an deren Stelle aus.
Lesen Sie auch > ChatGPT, Dall-E, midjourney… Wird KI uns arbeitslos machen?
Um mehr herauszufinden, haben wir die Teilnehmer zwei Monate nach dem Experiment interviewt. Viele Menschen nutzten es bereits in ihrer realen Arbeit. Sie betonten, dass das Tool in ihrem realen beruflichen Kontext weniger nützlich sei als während der Erfahrung, da ihre tägliche Arbeit spezifische Kenntnisse des Unternehmens, seiner Codes, seines Kommunikationsstils, präziser Kundenbedürfnisse usw. erforderte. Diese Elemente sind im Wesentlichen menschlich und schwieriger durch KI zu ersetzen.
Wenn Sie vor den größten politischen Persönlichkeiten der Welt stünden, was würden Sie ihnen sagen?
Dass für die nächsten 10 oder 20 Jahre eine große Revolution vorbereitet wird. Welche Auswirkungen dies in der Praxis haben könnte, wissen wir zum jetzigen Zeitpunkt allerdings noch nicht. Heute ist es an der Zeit, dass die Forschung diese Technologie und ihre Folgen vollständig versteht, um zu gegebener Zeit die am besten geeigneten öffentlichen Maßnahmen einführen zu können.