Kinder in Texas nehmen staatlich vorgeschriebene Medikamente ein standartisierte Tests diese Woche, um ihre Fähigkeiten in Lesen, Schreiben, Naturwissenschaften und Sozialkunde zu messen. Aber diese Tests werden nicht mehr unbedingt von menschlichen Lehrern bewertet. Tatsächlich wird die Texas Education Agency eine neue „automatisierte Bewertungsmaschine“ für offene Fragen zu den Tests einsetzen. Und der Staat hofft, mit dem neuen Programm Millionen einzusparen.
Laut der Texas Education Agency nutzt die Technologie, die von der Texas Education Agency als „Auto Scoring Engine“ (ASE) bezeichnet wird, die Verarbeitung natürlicher Sprache, um Aufsätze von Schülern zu bewerten Texas Tribune. Nach der ersten Bewertung durch das KI-Modell werden etwa 25 % der Testantworten zur Überprüfung an menschliche Bewerter zurückgesendet San Antonio-Bericht Nachrichtenagentur.
Texas rechnet damit, mit dem neuen KI-Tool etwa 15 bis 20 Millionen US-Dollar einzusparen, vor allem weil weniger menschliche Prüfer über eine externe Vertragsagentur eingestellt werden müssen. Früher wurden etwa 6.000 Klässler benötigt, laut der Texas Tribune wird diese Zahl jedoch auf etwa 2.000 reduziert.
Eine auf der Texas Education Agency veröffentlichte Präsentation Webseite scheint zu zeigen, dass Tests des neuen Systems ergaben, dass Menschen und das automatisierte System den meisten Kindern vergleichbare Ergebnisse lieferten. Es bleiben jedoch viele Fragen offen, wie die Technologie genau funktioniert und welches Unternehmen dem Staat möglicherweise bei der Entwicklung der Software geholfen hat. Zwei Bildungsunternehmen, Cambium und Pearson, werden auf der Website der Texas Education Agency als Auftragnehmer genannt, aber die Agentur antwortete nicht auf am Dienstag per E-Mail gesendete Fragen.
Die State of Texas Assessments of Academic Readiness (STAAR) wurden erstmals 2011 eingeführt, 2023 jedoch umgestaltet, um mehr offene Fragen im Essay-Stil aufzunehmen. Zuvor enthielt der Test viel mehr Fragen im Multiple-Choice-Format, die natürlich auch mit computergestützten Hilfsmitteln bewertet wurden. Der große Unterschied besteht darin, dass die Bewertung einer Blasentabelle anders ist als die Bewertung einer schriftlichen Antwort, was für Computer schwieriger zu verstehen ist.
Als Zeichen dafür, wie giftig KI-Tools im Mainstream-Tech-Diskurs geworden sind, hat die Texas Education Agency offenbar schnell alle Vergleiche mit generativen KI-Chatbots wie z chatgpt, so die Texas Tribune. Und die PowerPoint-Präsentation auf der Website der Texas Education Agency scheint dieses Unbehagen gegenüber Vergleichen mit ChatGPT zu bestätigen.
„Diese Art von Technologie unterscheidet sich von KI darin, dass KI ein Computer ist, der progressive Lernalgorithmen verwendet, um sich anzupassen, sodass die Daten die Programmierung übernehmen und sich im Wesentlichen selbst beibringen“, erklärt die Präsentation. „Stattdessen handelt es sich bei der automatisierten Bewertungsmaschine um eine geschlossene Datenbank mit Antwortdaten der Studierenden, auf die nur TEA und, mit strenger vertraglicher Datenschutzkontrolle, seine Bewertungsauftragnehmer Cambium und Pearson zugreifen können.“
Jede Familie, die mit der Note ihres Kindes unzufrieden ist, kann darum bitten, dass ein Mensch sich den Test noch einmal ansieht San Antonio-Bericht. Aber es kostet Sie 50 $.