× schließen
Bildnachweis: Pixabay/CC0 Public Domain
Ein internationales Team von Wissenschaftlern, darunter auch von der Universität Cambridge, hat eine neue Forschungskooperation gestartet, die dieselbe Technologie wie chatgpt nutzen wird, um ein KI-gestütztes Tool für wissenschaftliche Entdeckungen zu entwickeln.
Während ChatGPT mit Wörtern und Sätzen arbeitet, lernt die KI des Teams aus numerischen Daten und physikalischen Simulationen aus allen wissenschaftlichen Bereichen, um Wissenschaftlern bei der Modellierung aller Dinge zu helfen, von Überriesensternen bis hin zum Erdklima.
Das Team rief die Initiative ins Leben Polymathische KI Anfang dieser Woche, zusammen mit der Veröffentlichung einer Reihe verwandter Artikel zum Thema arXiv Open-Access-Repository.
„Dies wird die Art und Weise, wie Menschen KI und maschinelles Lernen in der Wissenschaft nutzen, völlig verändern“, sagte Shirley Ho, Leiterin der Polymathic AI, Gruppenleiterin am Center for Computational Astrophysics des Flatiron Institute in New York City.
Die Idee hinter Polymathic AI „ähnelt der Idee, dass es einfacher ist, eine neue Sprache zu lernen, wenn man bereits fünf Sprachen beherrscht“, sagte Ho.
Der Beginn mit einem großen, vorab trainierten Modell, einem so genannten Basismodell, kann sowohl schneller als auch genauer sein, als ein wissenschaftliches Modell von Grund auf neu zu erstellen. Das kann auch dann zutreffen, wenn die Trainingsdaten für das vorliegende Problem offensichtlich nicht relevant sind.
„Aufgrund des Umfangs der erforderlichen Rechenleistung war es schwierig, akademische Forschung an umfassenden Grundlagenmodellen durchzuführen“, sagte Co-Forscher Miles Cranmer vom Department of Applied Mathematics and Theoretical Physics und Institute of Astronomy in Cambridge. „Durch unsere Zusammenarbeit mit der Simons Foundation haben wir einzigartige Ressourcen erhalten, um mit der Prototypenentwicklung dieser Modelle für den Einsatz in der Grundlagenforschung zu beginnen, auf denen Forscher auf der ganzen Welt aufbauen können – das ist aufregend.“
„Polymathische KI kann uns Gemeinsamkeiten und Verbindungen zwischen verschiedenen Bereichen aufzeigen, die möglicherweise übersehen wurden“, sagte Co-Forscher Siavash Golkar, Gastforscher am Center for Computational Astrophysics des Flatiron Institute.
„In früheren Jahrhunderten waren einige der einflussreichsten Wissenschaftler Universalgelehrte mit einem weitreichenden Verständnis verschiedener Fachgebiete. Dies ermöglichte es ihnen, Zusammenhänge zu erkennen, die ihnen Inspiration für ihre Arbeit lieferten. Da jeder wissenschaftliche Bereich immer spezialisierter wurde, ist dies der Fall.“ Es wird immer schwieriger, in mehreren Bereichen an der Spitze zu bleiben. Ich denke, dies ist ein Ort, an dem uns KI helfen kann, indem sie Informationen aus vielen Disziplinen zusammenführt.“
Zum Polymathic AI-Team gehören Forscher der Simons Foundation und ihres Flatiron Institute, der New York University, der University of Cambridge, der Princeton University und des Lawrence Berkeley National Laboratory. Zum Team gehören Experten aus den Bereichen Physik, Astrophysik, Mathematik, künstliche Intelligenz und Neurowissenschaften.
Wissenschaftler haben bereits KI-Tools eingesetzt, diese wurden jedoch in erster Linie speziell entwickelt und anhand relevanter Daten trainiert.
„Trotz der rasanten Fortschritte des maschinellen Lernens in den letzten Jahren in verschiedenen wissenschaftlichen Bereichen werden in fast allen Fällen Lösungen für maschinelles Lernen für spezifische Anwendungsfälle entwickelt und anhand einiger sehr spezifischer Daten trainiert“, sagte Co-Forscher Francois Lanusse, ein Kosmologe am Zentrum National de la Recherche Scientifique (CNRS) in Frankreich.
„Dadurch entstehen Grenzen sowohl innerhalb als auch zwischen den Disziplinen, was bedeutet, dass Wissenschaftler, die KI für ihre Forschung nutzen, nicht von Informationen profitieren, die möglicherweise vorhanden sind, jedoch in einem anderen Format oder in einem völlig anderen Bereich.“
Das Projekt von Polymathic AI wird lernen, Daten aus verschiedenen Quellen aus der Physik und Astrophysik (und schließlich aus Bereichen wie Chemie und Genomik, sagen seine Schöpfer) zu nutzen und dieses multidisziplinäre Know-how auf ein breites Spektrum wissenschaftlicher Probleme anzuwenden. Das Projekt wird „viele scheinbar unterschiedliche Teilgebiete zu etwas verbinden, das größer ist als die Summe ihrer Teile“, sagte Projektmitglied Mariel Pettee, Postdoktorandin am Lawrence Berkeley National Laboratory.
„Wie weit wir diese Sprünge zwischen den Disziplinen schaffen können, ist unklar“, sagte Ho. „Das ist es, was wir tun wollen – versuchen, es möglich zu machen.“
ChatGPT weist bekannte Einschränkungen in Bezug auf die Genauigkeit auf (der Chatbot sagt beispielsweise, dass 2.023 mal 1.234 2.497.582 ergibt und nicht die richtige Antwort von 2.496.382). Das Projekt von Polymathic AI werde viele dieser Fallstricke vermeiden, sagte Ho, indem es Zahlen als tatsächliche Zahlen behandle und nicht nur Zeichen auf der gleichen Ebene wie Buchstaben und Satzzeichen. Für die Trainingsdaten werden auch echte wissenschaftliche Datensätze verwendet, die die dem Kosmos zugrunde liegende Physik erfassen.
Transparenz und Offenheit seien ein großer Teil des Projekts, sagte Ho. „Wir wollen alles öffentlich machen. Wir wollen KI für die Wissenschaft so demokratisieren, dass wir in ein paar Jahren der Community ein vorgefertigtes Modell zur Verfügung stellen können, das dabei helfen kann, wissenschaftliche Analysen auf breiter Front zu verbessern.“ Vielzahl von Problemen und Bereichen.
Mehr Informationen: Michael McCabe et al., Multiple Physics Pretraining für physikalische Ersatzmodelle, arXiv (2023). DOI: 10.48550/arxiv.2310.02994
Siavash Golkar et al, xVal: A Continuous Number Encoding for Large Language Models, arXiv (2023). DOI: 10.48550/arxiv.2310.02989
Francois Lanusse et al, AstroCLIP: Cross-Modal Pre-Training for Astronomical Foundation Models, arXiv (2023). DOI: 10.48550/arxiv.2310.03024