Nachfolgend finden Sie eine Zusammenfassung der Studie „Evaluating the strengths and limits of multimodal chatgpt-4 in detection of glaucoma using fundus images“, erschienen in der Juni-Ausgabe 2024 von Augenheilkunde von Musleh et al.
ChatGPT ist ein großes Sprachmodell (LLM), das ophthalmologische Fragen präzise beantworten kann. Seine Fähigkeit, Glaukom mithilfe von Farbfundusfotos (CFPs) aus einem Standarddatensatz ohne vorheriges Training oder Feinabstimmung zu erkennen, muss jedoch noch getestet werden.
Forscher führten eine prospektive Studie durch, in der sie die diagnostische Genauigkeit von ChatGPT-4 bei der Identifizierung von Glaukomfällen unter CFPs bewerteten und sich dabei auf die binären Klassifizierungen konzentrierten: „Wahrscheinlich glaukomatös“ oder „Wahrscheinlich nicht glaukomatös“.
Sie verwendeten den öffentlich verfügbaren Datensatz „Retinal Fundus Glaucoma Challenge (REFUGE)“ mit 400 Bildern zum Testen. ChatGPT-4 wurde verwendet, um die Bilder ohne vorheriges Training oder Feinabstimmung zu klassifizieren. Die Analyse konzentrierte sich auf die Erstellung einer Konfusionsmatrix zur Bewertung der Genauigkeit binärer Klassifizierungen.
Die Ergebnisse zeigten, dass ChatGPT-4 trotz fehlender Feinabstimmung eine bemerkenswert hohe Genauigkeit von 90 % (95 % KI: 87,06 %–92,94 %) aufwies. Die Sensitivität betrug 50 % (34,51 %–65,49 %), die Spezifität 94,44 % (92,08 %–96,81 %), die Präzision 50 % (34,51 %–65,49 %) und der F1-Score 0,50.
Die Forscher kamen zu dem Schluss, dass fortschrittliche KI-Modelle wie LLMs für das Training in medizinischen Spezialbereichen wie der Augenheilkunde möglicherweise weniger Daten benötigen. Solche Techniken könnten zur Entwicklung wertvoller medizinischer Instrumente führen, insbesondere in ressourcenarmen Umgebungen.
Quelle: frontiersin.org/journals/ophthalmology/articles/10.3389/fopht.2024.1387190/abstract