Laut einer am 22. Januar in veröffentlichten Studie zeigt chatgpt das Potenzial, Radiologen dabei zu helfen, bösartige Knochentumoren auf der Grundlage von CT-Bildgebungsbefunden in Radiologieberichten zu identifizieren Zeitschrift für Knochenonkologie.
Ein Team unter der Leitung von Fan Yang, MD, von der Capital Medical University in Peking berichtete, dass ein mit wenigen Schüssen trainiertes ChatGPT-Modell (d. h. ein Modell, das darauf trainiert wurde, mit nur wenigen Beispielen genaue Vorhersagen zu treffen) eine Genauigkeit von 87 % und eine Genauigkeit von 99 % aufwies. Empfindlichkeit für die Erkennung bösartiger Knochentumoren.
„Unsere Ergebnisse unterstreichen das Potenzial von ChatGPT bei der Diagnose von gutartigen und bösartigen Knochentumoren und bieten Vorteile wie eine höhere Effizienz und eine Reduzierung verpasster Diagnosen“, schrieb die Gruppe.
Knochenläsionen werden häufig im CT identifiziert und während einige tatsächlich bösartig sind, zeigen sich die meisten als gutartige Anomalien, erklärten Yang und Kollegen. Mehrdeutige diagnostische Fälle stellen für ChatGPT eine Herausforderung dar, da sich überschneidende gutartige und bösartige Bildgebungsmerkmale die Sache erschweren können, weshalb „die Zusammenarbeit zwischen Ärzten und ChatGPT im realen Umfeld von entscheidender Bedeutung ist“, stellten sie fest.
Um die Verwendung von ChatGPT zur Identifizierung bösartiger Knochenläsionen zu testen, führte das Team eine Studie durch, die 1.366 gutartige und bösartige Bildgebungsberichte zu Knochentumoren umfasste, die von 25 Ärzten interpretiert wurden. Die Berichte wurden in das ChatGPT-Modell eingegeben, das durch eine Few-Shot-Lernmethode trainiert wurde. Anschließend verglich das Team die Ergebnisse des Arztes mit den Ergebnissen des KI-Modells (sowohl vor als auch nach dem Training mit wenigen Schüssen) und analysierte alle falsch diagnostizierten Fälle auf Diagnosefehler und mögliche Ursachen für Fehldiagnosen.
Die Forscher fanden heraus, dass das Lernen mit wenigen Schüssen die Ergebnisse von ChatGPT verbesserte.
ChatGPT-Leistung zur Diagnose von Knochentumoren | ||
---|---|---|
Messen | Vor dem Wenig-Schuss-Lernen | Nach wenigen Schüssen Lernen |
Genauigkeit | 73 % | 87 % |
Empfindlichkeit | 95 % | 99 % |
Spezifität | 58 % | 73 % |
Das Team führte außerdem ein Experiment durch, bei dem der Einfluss des Berichtsstils der Radiologen auf ChatGPT analysiert wurde, und stellte fest, dass ChatGPT eine höhere Sensitivität bei der Interpretation von Berichten erfahrener Radiologen aufwies. Die Gruppe fand außerdem Folgendes:
- ChatGPT diagnostizierte 56 gutartige Fälle fälschlicherweise als bösartig. Davon wurden 35 gutartige Läsionen fälschlicherweise als metastatische Tumoren oder Osteosarkome identifiziert.
- Es diagnostizierte 23 Osteosarkomfälle fälschlicherweise als Osteomyelitis.
- Der Algorithmus diagnostizierte 8 Fälle von Chondrosarkom fälschlicherweise als fibröse Dysplasie oder aneurysmatische Knochenzyste.
- ChatGPT diagnostizierte außerdem vier Fälle von spinalem Chordom und Wirbelsäulentuberkulose falsch.
Die Studie legt nahe, dass ChatGPT bei der Diagnose von gutartigen und bösartigen Knochentumoren vielversprechend ist, eine Zusammenarbeit mit Lesern von Radiologen sei jedoch notwendig, so die Autoren.
„[Our findings underscore] die Notwendigkeit kollaborativer Interaktionen zwischen Ärzten und ChatGPT in der Praxis … [and] legt den Grundstein für zukünftige KI-Fortschritte in der Medizin“, schlussfolgerten sie. „Darüber hinaus [it shows] die Vorteile des Wenig-Schuss-Lernens bei der Feinabstimmung von ChatGPT-Anwendungen in speziellen Bereichen.“
Die vollständige Studie finden Sie hier Hier.