Von Cassidy Morrison, leitende Gesundheitsreporterin für Dailymail.Com 21:42 25. März 2024, aktualisiert 21:43 25. März 2024
- Schwerwiegende Ungenauigkeiten bei den KI-Antworten wurden nur bei vier von 140 Antworten festgestellt
- Die Technologie ist für Ärzte hilfreich, aber sie sollten sich nicht vollständig darauf verlassen
- LESEN SIE MEHR: chatgpt gab einfühlsamer Antworten als echte Ärzte in der Studie
Eine führende medizinische Einrichtung in den USA ermutigt gestresste Ärzte, ChatGPT zu nutzen, um Zeit zu sparen.
In einer neuen Studie wurde untersucht, wie gut das KI-Modell komplizierte medizinische Studien interpretieren und zusammenfassen kann. Ärzte werden dazu ermutigt, diese zu lesen, um über die neuesten Forschungs- und Behandlungsentwicklungen in ihrem Fachgebiet auf dem Laufenden zu bleiben.
Sie fanden heraus, dass der Chatbot in 98 Prozent der Fälle korrekt war und Ärzten schnelle und genaue Zusammenfassungen von Studien in einer Reihe von Fachgebieten lieferte, von der Kardiologie und Neurologie bis hin zur Psychiatrie und dem öffentlichen Gesundheitswesen.
Die American Academy of Family Physicians sagte, die Ergebnisse zeigten, dass ChatGPT „wahrscheinlich als Screening-Tool nützlich sein wird, um vielbeschäftigten Ärzten und Wissenschaftlern zu helfen“.
Der Bericht kommt zu einem Zeitpunkt, an dem sich KI heimlich in das Gesundheitswesen einschleicht. Berichten zufolge sehen zwei Drittel der Ärzte darin Vorteile. mit 38 Prozent der Ärzte Laut einer Umfrage der American Medical Association berichten sie, dass sie es bereits als Teil ihrer täglichen Praxis nutzen.
Rziemlich 90 Prozent der Krankenhaussysteme nutzen KI in irgendeiner Form, ein Anstieg gegenüber 53 Prozent im zweiten Halbjahr 2019.
Mittlerweile geschätzt 63 Prozent der Ärzte erlebten laut AMA im Jahr 2021 Burnout-Symptome.
Während die Covid-Pandemie das Burnout bei Ärzten verschlimmerte, war die Rate zuvor immer noch hoch: Etwa 55 Prozent der Ärzte gaben an, sich im Jahr 2014 ausgebrannt zu fühlen.
Die Hoffnung besteht darin, dass die KI-Technologie dazu beitragen wird, die hohen Burnout-Raten zu lindern, die zu einem Ärztemangel führen.
Ärzte aus Kansas, die der American Academy of Family Physicians angeschlossen sind, bewerteten die Fähigkeit der KI, klinische Berichte aus 14 medizinischen Fachzeitschriften zu analysieren und zusammenzufassen. Dabei überprüften sie, ob sie diese korrekt interpretierte und genaue Zusammenfassungen erstellen konnte, die Ärzte im Ernstfall lesen und verdauen konnten.
Schwerwiegende Ungenauigkeiten waren selten, was darauf hindeutet, dass vielbeschäftigte Ärzte sich auf KI-generierte Studienzusammenfassungen verlassen konnten, um sich über die neuesten Techniken und Entwicklungen in ihrem Fachgebiet zu informieren, ohne wertvolle Zeit mit Patienten zu opfern.
Die Forscher sagten: „Wir kommen zu dem Schluss, dass ChatGPT-Zusammenfassungen, da sie 70 % kürzer als Abstracts waren und in der Regel von hoher Qualität, hoher Genauigkeit und geringer Verzerrung waren, wahrscheinlich als Screening-Tool nützlich sein dürften, um vielbeschäftigten Klinikern und Wissenschaftlern zu helfen, schneller zu beurteilen, ob weitere Ergebnisse vorliegen.“ Die Rezension eines Artikels dürfte sich lohnen.'
Die Ärzte der University of Kansas testeten das ChatGPT-3.5-Modell, das von der Öffentlichkeit häufig verwendete Modell, um festzustellen, ob es Zusammenfassungen medizinischer Forschung zusammenfassen und die Relevanz dieser Artikel für verschiedene medizinische Fachgebiete bestimmen kann.
Sie haben zehn Artikel in das Sprachlernmodell der KI eingespeist, das darauf ausgelegt ist, menschliche Sprache basierend auf Training auf riesigen Textdatenmengen zu verstehen, zu verarbeiten und zu generieren. Die Fachzeitschriften spezialisierten sich auf verschiedene Gesundheitsthemen wie Kardiologie, Lungenmedizin, öffentliche Gesundheit und Neurologie.
Sie fanden heraus, dass ChatGPT Zusammenfassungen von Abstracts in hoher Qualität, hoher Genauigkeit und mit geringer Verzerrung erstellen konnte, obwohl dafür eine Beschränkung auf 125 Wörter vorgesehen war.
Nur vier der 140 von ChatGPT erstellten Zusammenfassungen enthielten schwerwiegende Ungenauigkeiten. Einer von ihnen ließ einen schwerwiegenden Risikofaktor für einen Gesundheitszustand außer Acht – die Tatsache, dass er weiblich ist.
Ein anderer Grund war ein semantisches Missverständnis des Maschinenmodells, während andere auf eine Fehlinterpretation der Versuchsmethoden zurückzuführen waren, beispielsweise darauf, ob sie doppelblind waren.
Die Forscher sagten: „Wir kommen zu dem Schluss, dass ChatGPT-Zusammenfassungen seltene, aber wichtige Ungenauigkeiten aufweisen, die verhindern, dass sie als definitive Quelle der Wahrheit angesehen werden.“
„Ärzte werden dringend davor gewarnt, sich ausschließlich auf ChatGPT-basierte Zusammenfassungen zu verlassen, um Studienmethoden und Studienergebnisse zu verstehen, insbesondere in Situationen mit hohem Risiko.“
Dennoch waren die meisten Ungenauigkeiten, die in 20 von 140 Artikeln festgestellt wurden, geringfügig und größtenteils auf mehrdeutige Sprache zurückzuführen. Die Ungenauigkeiten waren nicht erheblich genug, um die beabsichtigte Botschaft oder die Schlussfolgerungen des Textes drastisch zu verändern.
Alle zehn Studien wurden im Jahr 2022 veröffentlicht, was die Forscher mit Absicht taten, da KI-Modelle auf Daten trainiert wurden, die bis 2021 veröffentlicht wurden.
Durch die Einführung von Texten, die noch nicht zum Trainieren des KI-Netzwerks verwendet wurden, würden Forscher möglichst organische Antworten von ChatGPT erhalten, ohne dass sie durch Studien verunreinigt würden, die ihnen vorausgingen.
ChatGPT wurde gebeten, über die Qualität, Genauigkeit und Voreingenommenheit seiner schriftlichen Studienzusammenfassungen „selbst zu reflektieren“.
Selbstreflexion ist ein leistungsstarkes Sprachlernwerkzeug für KI. Es ermöglicht KI-Chatbots, ihre eigene Leistung bei bestimmten Aufgaben zu bewerten, z. B. bei der Analyse wissenschaftlicher Studien, indem sie sich auf komplexe Algorithmen verlassen, Methoden mit bereits etablierten Standards vergleichen und Wahrscheinlichkeiten zur Messung des Unsicherheitsgrads verwenden.
Eine der vielen Aufgaben eines Arztes ist es, über die neuesten Entwicklungen auf seinem Fachgebiet auf dem Laufenden zu bleiben. Aufgrund ihrer beruflichen Anforderungen, insbesondere der zeitnahen Betreuung ihrer Patienten, fehlt ihnen jedoch häufig die Zeit, sich mit wissenschaftlichen Studien und Fallberichten zu befassen.
Es gab Bedenken hinsichtlich Ungenauigkeiten in den Antworten von ChatGPT, die Patienten gefährden könnten, wenn sie nicht von geschulten Ärzten untersucht würden.
Das berichtete eine Studie, die letztes Jahr auf einer Konferenz der American Society of Health-System Pharmacists vorgestellt wurde fast drei Viertel der von Apothekern überprüften ChatGPT-Antworten auf drogenbezogene Fragen erwiesen sich als falsch oder unvollständig.
Gleichzeitig wurde festgestellt, dass ChatGPTs Antworten auf medizinische Fragen in 79 Prozent der Fälle einfühlsamer und qualitativ hochwertiger waren als die Antworten von Ärzten eines unabhängigen Ärztegremiums.
Das öffentliche Interesse an KI im Gesundheitswesen scheint gering zu sein, insbesondere wenn Ärzte zu stark darauf angewiesen sind. Eine Umfrage aus dem Jahr 2023 von Pew-Forschungszentrum fanden heraus, dass sich 60 Prozent der Amerikaner damit „unwohl“ fühlen würden.
Unterdessen gaben 33 Prozent der Befragten an, dass dies zu schlechteren Ergebnissen für die Patienten führen würde, während 27 Prozent meinten, dass es keinen Unterschied machen würde.
Zeitsparende Maßnahmen sind für Ärzte von entscheidender Bedeutung, um ihnen mehr Zeit für die von ihnen betreuten Patienten zu geben. Derzeit haben Ärzte für jeden Patienten etwa 13 bis 24 Minuten Zeit.
Andere Aufgaben im Zusammenhang mit Patientenabrechnungen, elektronischen Gesundheitsakten und Terminplanung nehmen schnell größere Teile der Zeit der Ärzte in Anspruch.
Der durchschnittliche Arzt verbringt fast neun Stunden pro Woche mit der Verwaltung. Psychiater verbrachten den größten Teil ihrer Zeit damit – 20 Prozent ihrer Arbeitswochen – gefolgt von Internisten (17,3 Prozent) und Hausärzten/Hausärzten (17,3 Prozent).
Der Verwaltungsaufwand nimmt zu messbare Belastung für US-Ärzte, die bereits vor der globalen Pandemie zunehmend unter Burnout litten. Die Association of American Medical Colleges prognostiziert bis 2034 einen Ärztemangel von bis zu 124.000, eine erschreckende Zahl, die viele auf steigende Burnout-Raten zurückführen.
Dr. Marilyn Heine, eine Treuhänderin der American Medical Association, sagte: „AMA-Studien haben gezeigt, dass ein hoher Verwaltungsaufwand für Ärzte und Burnout auftreten und dass diese miteinander verbunden sind.“
Die neuesten Erkenntnisse wurden in der Zeitschrift veröffentlicht Annalen der Familienmedizin.