Abstract:
Bei der Lösung globaler Herausforderungen, wie der nachhaltigen Bewirtschaftung und Nutzung der verfügbaren Grundwasserressourcen, ist die Entwicklung neuer, effizienter und leicht übertragbarer Modellierungsansätze von entscheidender Bedeutung. Hierfür bieten sich vor allem künstliche neuronale Netze (KNN) an, die als Verfahren des maschinellen Lernens selbstständig relevante Zusammenhänge aus größeren Datensätzen geeigneter Parameter lernen und nutzen können. Die vorliegende Arbeit untersucht die Nutzung von KNN zu Modellierung und Vorhersage von hydrogeologischen Zeitreihen. ... mehrIn vier Studien, die den Hauptteil dieser Arbeit bilden, werden verschiedene Fragestellungen entwickelt und deren Lösbarkeit mit Hilfe von KNN demonstriert.
Das Clustern von Ganglinien ist eine Möglichkeit räumliche und zeitliche Muster der Grundwasserdynamik zu erkennen. Dies ist wichtig um Aquifere zu charakterisieren, Einflussfaktoren zu identifizieren und effektive Bewirtschaftungsmethoden zu entwickeln. Aus diesen Gründen wird in der ersten Studie auf Basis von Self-Organizing Maps ein Clustering Verfahren entwickelt, mit dessen Hilfe sich in heterogenen Datensätzen von Grundwasserganglinien solche mit ähnlicher Dynamik gruppieren lassen. Das Verfahren nutzt zur Charakterisierung der Grundwasserdynamik sogenannte Features, die auch die Verarbeitung von Ganglinien mit variabler Datenqualität ermöglichen. Anhand eines Datensatzes von ca. 1800 wöchentlichen Ganglinien wird die Anwendung im Oberrheingraben in Deutschland und Frankreich erfolgreich demonstriert. Eine Analyse der Clusterergebnisse zeigt, dass sich externe Einflussfaktoren räumlich und zeitlich komplex überlagern und eine Trennung häufig nicht möglich ist. Dennoch sind einige Cluster eindeutig auf externe Faktoren (z.B. Grundwasserbewirtschaftung) zurückzuführen.
Es folgt ein detaillierter Vergleich verschiedener KNN Modelle zur Grundwasserstandsvorhersage. Untersucht werden hierbei Nonlinear Autoregressive Models with Exogenous Inputs (NARX), Long Short-Term Memory Networks (LSTM) und Convolutional Neural Networks (CNN) sowohl jeweils für Einzelwert- als auch Sequenzvorhersagen. Als Eingangsdaten werden nur wenige, aber dafür weithin verfügbare und leicht zu messende meteorologische Parameter verwendet, wodurch die breite Übertragbarkeit des Ansatzes gewährleistet ist. Es zeigt sich, dass alle Modelltypen grundsätzlich gute Prognoseeigenschaften aufweisen und NARX hierbei in der Regel die präzisesten Vorhersagen treffen, dicht gefolgt von CNNs. Für die praktische Anwendbarkeit zeigen CNNs insgesamt das größte Potenzial, da diese eine geringere Abhängigkeit von der pseudorandomisierten Netzinitialisierung als NARX sowie eine vielfach höhere Berechnungsgeschwindigkeit aufweisen als beide rekurrenten Alternativen. Dabei erreichen CNNs dennoch eine hohe Güte und sind gleichzeitig flexibel implementierbar. CNNs bilden daher die Grundlage für weitere untersuchte Fragestellungen.
Die nachfolgende Studie untersucht die Entwicklung der Grundwasserstände in Deutschland im Kontext des Klimawandels. Hierfür werden auf Basis von CNNs und anhand von Temperatur und Niederschlag aus drei Klimaszenarien (RCP2.6, 4.5 und 8.5) die zukünftigen Grundwasserstände an 118 ausgewählten Messstellen in Deutschland modelliert und der direkte Einfluss des zukünftigen Klimas abgeschätzt. Wichtige sekundäre Faktoren wie anthropogene Einflüsse, werden jedoch nicht in die Simulationen mit einbezogen. Unter RCP8.5 (pessimistisches Szenario) sind flächenhaft und ausgeprägt fallende Grundwasserstände zu erwarten, mit einem räumlichen Muster von stärkeren Abnahmen vor allem in Nord- und Ostdeutschland. Ebenfalls abnehmende Trends zeigen die Ergebnisse für die optimistischeren Szenarien RCP2.6 und RCP4.5, jedoch mit vergleichsweise wenig signifikanten Veränderungen. Hier wird der positive Einfluss der verminderten Treibhausgasemissionen deutlich, jedoch werden auch noch für das optimistischste Szenario RCP2.6 in einigen Projektionen deutschlandweit abnehmende Grundwasserstände festgestellt.
Abschließend stehen Karstquellschüttungen im Fokus der Arbeit. Zur Modellierung werden zum einen die vorhandenen CNN Ansätze herangezogen, zum anderen wird ein ebenfalls auf CNNs basierender 2D-Ansatz entwickelt, der die direkte Verarbeitung von flächenhaften Rasterdaten als Inputs erlaubt. Hierdurch lässt sich vielfach das Problem der ungenügenden Datenverfügbarkeit von meteorologischen Eingabedaten im Einzugsgebiet lösen. Beide Ansätze zeigen in allen Testgebieten sehr gute Ergebnisse und übertreffen teils die Ergebnisse bereits existierender Modelle. Der direkte Vergleich zwischen herkömmlichem und flächenhaftem Modellierungsansatz erlaubt kein abschließendes Urteil zur Überlegenheit einer der beiden Ansätze hinsichtlich der Genauigkeit der Ergebnisse. Die räumliche und zeitliche Vollständigkeit der Eingabedaten ist jedoch ein schwerwiegender Vorteil des flächenhaften Ansatzes. Weiterhin zeigt der flächenhafte Ansatz Potenzial für die Lokalisierung und, bei entsprechender Datenverfügbarkeit und Weiterentwicklung des Ansatzes, auch für die Abgrenzung von Quelleinzugsgebieten im Karst.
Abstract (englisch):
In solving global water challenges, such as the sustainable management and use of available groundwater resources, finding new, efficient, and easily transferable modeling approaches is crucial. Machine learning methods such as artificial neural networks (ANNs) are particularly suitable for this purpose. They can autonomously learn and leverage relevant relationships from larger data sets of suitable variables. After achieving major successes in several other fields, ANNs and especially their subset of deep learning models are becoming more and more successful in the hydrological sciences. ... mehrThis thesis investigates the use of ANNs to model and predict hydrogeological time series. Four studies constitute the main part of this work and demonstrate how ANNs can contribute to solving different problems in this research domain.
Groundwater hydrograph clustering is useful for identifying spatial and temporal dynamic patterns, which helps to characterize aquifer systems, identify influencing factors, and develop effective groundwater management strategies. Therefore, in the first study, an unsupervised clustering approach based on self-organizing maps is developed, capable of effectively grouping heterogeneous hydrograph datasets based on time series dynamics. A feature-based approach helps to robustly characterize hydrograph dynamics with variable data quality (e.g., data gaps or different periods). Using a data set of about 1800 weekly groundwater hydrographs, the application of the developed approach is successfully demonstrated in the Upper Rhine Graben area in Germany and France. Results show that groundwater dynamics are influenced by a variety of factors that superimpose spatially and temporarily, and often are hard to separate. Nevertheless, some clusters are clearly connected to specific external controlling factors, such as intensive groundwater management in the northern part of the study area.
Next, a detailed model comparison of different ANNs for groundwater level prediction tasks follows. The study compares nonlinear autoregressive exogenous models (NARX), long short-term memory networks (LSTM), and convolutional neural networks (CNN), each for both sequence-to-value and sequence-to-sequence prediction tasks. Furthermore, the models use only a few widely available and easy-to-measure meteorological input variables, which ensures the high transferability of the approach. All models show good predictive capabilities, however, NARX are, on average, the most precise ones, followed closely by CNNs, LSTMs are last. For practical applications, CNNs appear best overall because they are less dependent on the random network initialization than NARX and much faster to compute than both recurrent alternatives. At the same time, they achieve high performance and can be implemented flexibly.
The subject of the subsequent study is the development of groundwater levels in Germany in the context of the climate crisis. Climate data from three climate scenarios (RCP2.6, 4.5, and 8.5) form the basis to model the direct influence of climate on groundwater using a CNN-based approach. Focusing on the direct influence means the study does not consider indirect influencing factors that are highly uncertain in the future, such as anthropogenic groundwater extractions or vegetation and land-use changes. While future developments under the optimistic RCP2.6 and the intermediate RCP4.5 result in less pronounced and fewer significant trends, the pessimistic RCP8.5 causes significantly declining groundwater levels trends for most sites, revealing a spatial pattern of stronger decreases in the northern and eastern part of Germany. The positive influence of mitigated greenhouse gas emissions is evident in the results of RCP2.6. Still, groundwater levels decrease across Germany, depending on the investigated climate model.
Finally, this thesis investigates ANNs for modeling karst spring discharge. Both the existing CNN approach and a new 2D-model that allows for direct processing of spatially distributed input data are deployed. The latter can potentially overcome the problem of limited meteorological data availability in karst catchment areas. Both approaches achieve accurate modeling results in all three test areas and partly exceed the results of already existing approaches. None of the approaches is superior in terms of accuracy. However, apart from a considerably increased computation time, the data's spatially, and temporally complete nature and the associated number of available input variables are key benefits of the 2D-approach. The 2D-models learn relevant parts of the input data automatically, and a spatial input sensitivity analysis demonstrates their usefulness to localize the position of karst catchments.