× schließen
Ein Überblick über die Kombination von Geowissen und GPT zur Erkennung von Standortbeschreibungen und deren Kategorien aus Social-Media-Nachrichten. Kredit: Internationale Zeitschrift für geografische Informationswissenschaft (2023). DOI: 10.1080/13658816.2023.2266495
Etwas mehr als ein Jahr nach seiner Einführung sind die Fähigkeiten von ChatGPT bekannt. Das Modell des maschinellen Lernens kann einen anständigen Aufsatz auf College-Niveau schreiben und ein Gespräch auf fast menschenähnliche Weise führen.
Aber könnten seine Sprachkenntnisse auch Ersthelfern dabei helfen, bei einer Naturkatastrophe in Not geratene Menschen zu finden?
Eine neue von der Universität Buffalo durchgeführte Studie trainiert ChatGPT darin, Standorte in den Social-Media-Beiträgen von Katastrophenopfern zu erkennen, von Privatadressen bis hin zu Kreuzungen.
Ausgestattet mit sorgfältig konstruierten Eingabeaufforderungen extrahierten die „geoknowledge-gesteuerten“ GPT-Modelle der Forscher Standortdaten aus Tweets, die während des Hurrikans Harvey gesendet wurden, mit einer um 76 % höheren Genauigkeit als Standard-GPT-Modelle.
„Dieser Einsatz von KI-Technologie kann Ersthelfern möglicherweise dabei helfen, Opfer schneller zu erreichen und sogar mehr Leben zu retten“, sagte Yingjie Hu, außerordentlicher Professor am UB Department of Geography am College of Arts and Sciences und Hauptautor der Studie Studie, die war veröffentlicht im Oktober im Internationale Zeitschrift für geografische Informationswissenschaft.
Katastrophenopfer haben sich häufig an soziale Medien gewandt, um um Hilfe zu bitten, wenn die 911-Notrufsysteme überlastet waren, unter anderem während Harveys Verwüstung der Gegend von Houston im Jahr 2017.
Doch Ersthelfer verfügen oft nicht über die Ressourcen, um während einer Katastrophe die Social-Media-Feeds zu überwachen, die verschiedenen Hashtags zu verfolgen und zu entscheiden, welche Beiträge am dringendsten sind.
Das von der UB geleitete Forschungsteam, zu dem auch Mitarbeiter der University of Georgia, der Stanford University und von google gehören, hofft, dass ihre Arbeit zu KI-Systemen führen könnte, die Social-Media-Daten für Notfalldienste automatisch verarbeiten.
„ChatGPT und andere große Sprachmodelle haben wegen ihrer potenziellen negativen Verwendungsmöglichkeiten, sei es akademischer Betrug oder die Beseitigung von Arbeitsplätzen, Kontroversen ausgelöst, daher ist es spannend, ihre Kräfte stattdessen für das soziale Wohl zu nutzen“, sagt Hu.
„Obwohl es eine Reihe wichtiger und berechtigter Bedenken hinsichtlich der Entstehung von ChatGPT gibt, zeigt unsere Arbeit, dass sorgfältige, interdisziplinäre Arbeit Anwendungen dieser Technologie hervorbringen kann, die der Gesellschaft greifbare Vorteile bringen können“, fügt Co-Autor Kenneth Joseph, Assistenzprofessor in, hinzu die UB-Abteilung für Informatik und Ingenieurwesen innerhalb der Fakultät für Ingenieurwissenschaften und angewandte Wissenschaften.
Verschmelzung von „Geokwissen“ mit ChatGPT
Stellen Sie sich einen Tweet mit einer dringenden, aber klaren Botschaft vor: Eine Familie, darunter ein 90-Jähriger, der nicht stabil auf den Beinen ist, muss in 1280 Grant St., Cypress, Texas, 77249 gerettet werden.
Ein typisches Modell, beispielsweise ein NER-Tool (Named Entity Recognition), würde die aufgelistete Adresse als drei separate Entitäten erkennen: Grant Street, Cypress und Texas. Wenn diese Daten zur Geolokalisierung verwendet würden, würde das Modell Ersthelfer nicht zur 1280 Grant St., sondern in die Mitte der Grant Street oder sogar in den geografischen Mittelpunkt von Texas schicken.
Hu sagt, dass NER-Tools darauf trainiert werden können, vollständige Standortbeschreibungen zu erkennen, dafür wäre jedoch ein großer Datensatz genau beschrifteter Standortbeschreibungen für ein bestimmtes lokales Gebiet erforderlich, ein arbeitsintensiver und zeitaufwändiger Prozess.
„Obwohl es an gekennzeichneten Datensätzen mangelt, wissen Ersthelfer viel über die Art und Weise, wie Orte in ihrer Umgebung beschrieben werden, sei es der Name eines Restaurants oder eine beliebte Kreuzung“, sagt Hu. „Also haben wir uns gefragt: Wie können wir dieses Geowissen schnell und effizient in ein Modell für maschinelles Lernen einfließen lassen?“
Die Antwort waren die Generative Pretrained Transformers (GPT) von OpenAI, große Sprachmodelle, die bereits aus Milliarden von Webseiten trainiert wurden und in der Lage sind, menschenähnliche Antworten zu generieren. Durch einfache Gespräche und die richtigen Aufforderungen glaubte Hus Team, dass GPT schnell lernen könnte, Standortdaten aus Social-Media-Beiträgen genau zu interpretieren.
Zunächst stellten die Forscher GPT 22 echte Tweets von Opfern des Hurrikans Harvey zur Verfügung, die sie bereits in einer früheren Studie gesammelt und gekennzeichnet hatten. Sie teilten GPT mit, welche Wörter in dem Beitrag einen Ort beschrieben und welche Art von Ort er beschrieb, sei es eine Adresse, eine Straße, eine Kreuzung, ein Geschäft oder ein Wahrzeichen.
Anschließend testeten die Forscher das geoknowledge-gesteuerte GPT an weiteren 978 Hurrikan-Harvey-Tweets und baten es, die Ortswörter zu extrahieren und die Ortskategorie selbst zu erraten.
Die Ergebnisse: Die geowissensgesteuerten GPT-Modelle waren 76 % besser bei der Erkennung von Ortsbeschreibungen als GPT-Modelle ohne Geowissen und 40 % besser als NER-Tools. Am besten schnitten die Geoknowledge-gesteuerten GPT-3 und GPT-4 ab, während das Geoknowledge-gesteuerte ChatGPT nur knapp dahinter lag.
„GPT kombiniert im Wesentlichen die große Menge an Texten, die es bereits gelesen hat, mit den spezifischen Geowissensbeispielen, die wir bereitgestellt haben, um seine Antworten zu bilden“, sagt Hu. „GPT hat die Fähigkeit, schnell zu lernen und sich schnell an ein Problem anzupassen.“
Entscheidend ist jedoch die menschliche Note, also eine gute Ansprache. GPT betrachtet beispielsweise einen Autobahnabschnitt zwischen zwei bestimmten Ausfahrten möglicherweise nicht als Standort, es sei denn, er wird ausdrücklich dazu aufgefordert.
„Dies unterstreicht, wie wichtig es für uns als Forscher ist, GPT so genau und umfassend wie möglich anzuleiten, damit es die von uns benötigten Ergebnisse liefern kann“, sagt Hu.
Lassen Sie Ersthelfer das tun, was sie am besten können
Hus Team begann seine Arbeit Anfang 2022 mit GPT-2 und GPT-3 und schloss später GPT-4 und ChatGPT ein, nachdem diese Modelle Ende 2022 bzw. Anfang 2023 auf den Markt kamen.
„Unsere Methode wird wahrscheinlich auf die neueren GPT-Modelle anwendbar sein, die in den folgenden Jahren auf den Markt kommen könnten“, sagt Hu.
Es müssen weitere Untersuchungen durchgeführt werden, um mithilfe der von GPT extrahierten Ortsbeschreibungen tatsächlich Opfer zu geolokalisieren und möglicherweise Möglichkeiten zu finden, irrelevante oder falsche Beiträge über eine Katastrophe herauszufiltern.
Hu hofft, dass ihre Bemühungen den Einsatz von KI-Technologien vereinfachen können, sodass Notfallmanager nicht selbst KI-Experten werden müssen, um diese zu nutzen, und sich auf die Rettung von Leben konzentrieren können.
„Ich denke, eine gute Möglichkeit für Menschen, mit KI zusammenzuarbeiten, besteht darin, dass sich jeder von uns auf das konzentrieren kann, worin er wirklich gut ist“, sagt Hu. „Lassen Sie uns von KI-Modellen dabei helfen, diese arbeitsintensiveren Aufgaben zu erledigen, während wir Menschen uns darauf konzentrieren, Wissen zu erlangen und dieses Wissen als Leitfaden für KI-Modelle zu nutzen.“
Mehr Informationen: Yingjie Hu et al., Geowissensgesteuerte GPT-Modelle verbessern die Extraktion von Standortbeschreibungen aus katastrophenbezogenen Social-Media-Nachrichten, Internationale Zeitschrift für geografische Informationswissenschaft (2023). DOI: 10.1080/13658816.2023.2266495