Als chatgpt vor etwas weniger als einem Jahr der Öffentlichkeit vorgestellt wurde, waren die Benutzer vom Wissen, den Konversationsfähigkeiten und den Schreibfähigkeiten des KI-Chatbots begeistert. Nachdem es von einem menschlichen Benutzer dazu aufgefordert wurde, generiert das große Sprachmodell Antworten, indem es vorhersagt, welches Wort auf das vorherige folgen soll, und dabei die Eingabeaufforderung, alle vorherigen Wörter und sein umfangreiches Training anhand der im Internet verfügbaren Informationen berücksichtigt.
Mit dieser Formel kann ChatGPT scheinbar „nachdenkliche“, kohärente und gut geschriebene Inhalte erstellen. Viele Zuschauer prognostizierten bald, dass Schüler und Studenten die KI nutzen würden, um ihre Aufsätze für sie zu schreiben. Zum Zeitpunkt dieser Prognosen war jedoch nicht klar, ob die von ChatGPT erstellten Aufsätze den von Studierenden verfassten Aufsätzen tatsächlich überlegen waren.
Studenten vs. KI
Wir haben jetzt starke Beweise dafür, dass dies der Fall ist. In einem neuen Studie in der Zeitschrift veröffentlicht Wissenschaftliche BerichteForscher der Fakultät für Informatik und Mathematik der Universität Passau stellten 111 Gymnasiallehrern in Deutschland jeweils sechs Aufsätze zur Bewertung zur Verfügung. Den Lehrern wurde gesagt, dass sie jeden Aufsatz anhand einer Skala von null bis sechs hinsichtlich Thema und Vollständigkeit, Logik und Komposition, Ausdruckskraft und Vollständigkeit, Sprachbeherrschung, Komplexität, Wortschatz und Textverknüpfungen sowie Sprachkonstrukte bewerten sollten.
Ohne dass die Lehrer wussten, wurden einige der Aufsätze von echten Schülern im Alter von 16 bis 18 Jahren verfasst, während andere mit ChatGPT-3.5 oder ChatGPT-4 erstellt wurden, wobei letzteres fortgeschrittener ist. Die Aufsätze waren alle „argumentativ“ und verlangten von den Studierenden (oder KIs), kritisch über ein Thema nachzudenken, dann eine Position festzulegen und diese mit Beweisen zu untermauern. Insgesamt bewerteten die Lehrer 270 Aufsätze zu 90 Themen.
Als die Forscher die Ergebnisse zusammenzählten, stellten sie fest, dass ChatGPT die Studenten bei allen Kriterien deutlich übertraf. Studentenaufsätze erhielten eine durchschnittliche Punktzahl von 3,69 von 6, während ChatGPT-3.5 eine Punktzahl von 4,36 und ChatGPT-4 eine Punktzahl von 4,68 erzielte. (Die Forscher untersuchten nur Oberstufenschüler; es ist wahrscheinlich, dass College-Studenten bessere Leistungen erbracht hätten.)
Interessanterweise stellten die Forscher fest, dass ChatGPT einige sehr roboterhafte Schreibticks hatte. Beispielsweise begann jeder der von KI verfassten Aufsätze den Schlussabsatz mit der Formulierung „abschließend“. Die einleitenden Sätze begannen im Allgemeinen mit einer allgemeinen Aussage, die die Hauptkonzepte der Aufsatzthemen verwendete.
„Obwohl dies der allgemeinen Struktur entspricht, die für argumentative Essays angestrebt wird, ist es auffällig, dass die ChatGPT-Modelle so starr sind“, kommentierten die Autoren.
Solche Tendenzen könnten es Pädagogen ermöglichen, von KI erstellte Werke, die angeblich abgegeben werden, als von Menschenhand geschaffen zu identifizieren und Schüler entsprechend zu bestrafen. Die Forscher glauben jedoch, dass ein solcher Vorstoß zur Aufrechterhaltung des Bildungsstatus quo durch den Ausschluss von KIs wie ChatGPT ein Problem wäre verpasste Gelegenheit. Da sich KI-Modelle verbessern und bestimmte menschliche Anstrengungen zunehmend überflüssig machen, warum sollte man die Bildung nicht stattdessen auf modernere Beschäftigungen ausrichten, die für dieses unbestreitbar technologiegetriebene Zeitalter besser geeignet sind?
„Fortschrittliche Chatbots könnten als leistungsstarke Unterrichtshilfen eingesetzt werden, die den Unterricht interaktiver gestalten, Schülern Medienkompetenz vermitteln, personalisierte Unterrichtspläne erstellen, Lehrern Zeit bei der Verwaltung sparen und vieles mehr“, sagt Will Douglas Heaven schrieb für MIT Technology Review früher in diesem Jahr.
Heaven hat einen Pädagogen interviewt, dessen Leistungen angesichts der aktuellen Studie äußerst zutreffend sind. Während sie früher von ihren Schülern verlangte, argumentative Aufsätze zu schreiben, bittet sie ihre Schüler jetzt, diese von ChatGPT erstellen zu lassen. Anschließend werden die Schüler damit beauftragt, die Arbeit zu überarbeiten und die Argumente der KI zu bewerten und dabei ihre Wirksamkeit bei bestimmten Zielgruppen zu berücksichtigen. Die Schüler geben dann eine Neufassung ab.
Wie ein Taschenrechner, aber für Aufsätze
Die Forscher der Universität Passau sind der Meinung, dass ChatGPT nicht als Betrugstool, sondern vielmehr als „der neue Taschenrechner“ betrachtet werden sollte, der der Mathematik viel Arbeit abgenommen hat. Den Schülern sollte im Unterricht ausführlich das Schreiben beigebracht werden, ihnen jedoch schließlich die Nutzung von ChatGPT gestattet werden, sobald sie ausreichende Kenntnisse erlangt haben. Anschließend können sie die Arbeit der KI korrigieren, stilisieren und verfeinern.
„Unsere Ergebnisse liefern einen starken Hinweis darauf, dass die Befürchtungen vieler Lehrkräfte berechtigt sind: Die Art und Weise, wie Schüler Hausaufgaben machen und Lehrer dies beurteilen, muss sich in einer Welt generativer KI-Modelle ändern“, schreiben die Forscher.
Angst vor Veränderungen ist natürlich, vergeht aber regelmäßig mit der Zeit. ChatGPT könnte endlich der Anstoß sein, der längst überfällige Veränderungen in der Bildung herbeiführt und sie von einem System, das sich um das Auswendiglernen und Wiedergeben von Fakten dreht, in ein System verwandelt, das Logik, Argumentation und kritisches Denken lehrt. Die Bildung behandelt Schüler oft wie Roboter und nicht wie Menschen. Stattdessen sollten wir die Roboterarbeit vielleicht der KI überlassen.