Wie der Datenschatz der BGR gehoben werden soll
Hauskolloquium am Dienstag, den 08. April 2025 um 10°° Uhr im Großen Sitzungssaal des Hauses
Moderation: Tino Langos
Einleitung
Bei fast jedem neuen Projekt der BGR stellt sich zu Beginn die Frage: „Was kann die BGR selbst an Daten für meine Fragestellungen beisteuern?“ Damit die Recherche nicht schon Inhouse in einer Odyssee durch etliche Fachinformationssysteme, Shares und Zugriffsrechte ausartet, wurde ein neues Datenmanagementsystem (kurz DAMAST) entwickelt. Im ersten Teil erfahren sie, wie das Repository es schafft, alle Daten der BGR zugänglich zu machen und gleichzeitig zu vernetzen.
Dabei sind wir nicht stehengeblieben, wie wir im zweiten Teil erfahren. KI gestützte Datenanalysen helfen nicht nur bei der lästigen Metadatenerfassung, sondern bieten künftig ganz neue Wege der Exploration unserer Datenschätze.
Röhling, S., Arns-Krogmann, G. & Team DAMAST: DAMAST – Schatzkammer der Daten der BGR
Abb. 1: Vernetzung von Fachdaten in DAMAST
Quelle: BGR
Frage: „Wo bekomme ich einen guten Überblick über die INTERNEN Daten der BGR?“. Antwort: „Dafür muss die ganze BGR befragt werden!“. Diese derzeit unbefriedigende Antwort zu ersetzen durch „Natürlich in DAMAST!“ ist das Ziel dieses neuen Datenmanagementsystems. DAMAST möchte im Kern alle geowissenschaftlichen Daten der Abteilung B3 registrieren und zugänglich machen oder auf interne Datenbestände hinweisen, um diese domänenübergreifend zu vernetzen. Über eine zentrale Anwendung können verschiedene Typen von Fachdaten (s. Abb. 1, rot: Berichte, Seismik, Bohrdaten, etc.) recherchiert werden. Alle Daten sind dabei immer ihrem Ursprungsprojekt zugeordnet und weisen zudem einen Raumbezug auf, der eine geographische Suche ermöglicht Neubearbeitungen oder Fortschreibungen sind durch eine automatische Versionierung derart verkettet, dass jeder jemals freigegebene Stand in jedem Projekt dauerhaft für alle erreichbar bleibt.
Datendateien können formatunabhängig über DAMAST geteilt werden und lassen sich gebündelt in einem Fachdatentyp mit Daten in anderen Fachinformationssystemen der BGR (s. Abb. 1, blau: ELVIS, GDI-BGR) verknüpfen. So entsteht durch die Verlinkung ein Netzwerk, welches der Nutzer sich selbst erschließen kann, wenn er den Bezügen folgt. Ziel ist es, DAMAST auf die gesamte BGR zu übertragen. Damit wird DAMAST zum Einstiegstor zur Schatzkammer der BGR.
Brysch, M.: Der neue Schlüssel zur Welt der Datenschätze der BGR durch KI
In der heutigen datengetriebenen Welt besteht häufig die Herausforderung darin, relevante Informationen aus großen und komplexen Datenbeständen effizient zu identifizieren sowie deren Zusammenhänge und Strukturen sichtbar zu machen. Aufgrund der stetig wachsenden Menge und Vielfalt dieser Daten bedarf es neuer, leistungsfähiger Ansätze, um verborgene Muster zu erkennen und daraus verwertbares Wissen abzuleiten. Genau hier setzen moderne Methoden des maschinellen Lernens an, indem sie helfen, Beziehungen zwischen einzelnen Datenpunkten zu analysieren und unterschiedliche Datenquellen effektiv miteinander zu verknüpfen (s. Abb. 2).
Abb. 2: Geowissenschaft trifft KI und Zukunft
Quelle: Dall_E 3
Die Integration von Daten aus vielfältigen Quellen ist essenziell, um ein umfassenderes und detaillierteres Gesamtbild zu schaffen und dadurch neue Erkenntnisse zu generieren. Insbesondere Technologien aus dem Bereich der Sprachmodelle bieten dabei völlig neue Perspektiven und ermöglichen innovative Ansätze in der Datenanalyse.
Der Einsatz solcher Modelle erlaubt die automatisierte Analyse großer Datenmengen, die Identifikation relevanter Zusammenhänge sowie die Extraktion wichtiger Informationen. Damit können bisher ungenutzte Wissenspotenziale freigesetzt werden. Diese Technologien eröffnen zudem die Möglichkeit, direkt mit Projektdaten in einen interaktiven Dialog zu treten. Genau dies ist das Ziel aktueller technologischer Entwicklungen: Die Schaffung intuitiver Schnittstellen, die einen direkten Zugang zum vorhandenen Wissen ermöglichen, um fundierte Entscheidungen schneller zu treffen.
An mehreren Beispielprojekten zeigen wir, wie diese Technologien konkret eingesetzt werden können. Hier wurde eine Schnittstelle entwickelt, die es ermöglicht, detaillierte Fragen zu Projekten, Risiken oder Fortschritten in natürlicher Sprache zu formulieren und direkt Antworten zu erhalten. Dieses Beispiel verdeutlicht, wie mit Hilfe moderner Technologien Zeit eingespart und Entscheidungen auf einer soliden Informationsbasis getroffen werden können.
Try Damast: https://damast.app.local (nur intern)
Spoiler zu DAMAST: DAMAST-Projektseite (nur intern)
Über den Meeting-Link beitreten:
https://bgr-bund.webex.com/bgr-bund/j.php?MTID=m9f9eee2c93a3c59953f66ca9e19e5d38; Meeting-Kennnummer (Zugriffscode): 2743 102 3849 Meeting Passwort: JFpybSAx443