Abstract:
Extreme Wetterbedingungen haben zu erheblichen Verlusten im Agrarsektor geführt. Dies ist in mehreren Ländern Europas deutlich geworden, in dem zuvor unbekannte Wetter- und Klimaextreme zu rekordverdächtigen Rückgängen der Ernteerträge geführt haben. In diesem Zusammenhang benötigen Entscheidungsträger:innen und politische Akteur:innen ein tieferes Verständnis darüber, wie Wetter und Klima die landwirtschaftliche Produktion beeinflussen, um wirksame, auf bestimmte Kulturen und Standorte zugeschnittene Anpassungsstrategien zu entwickeln. Statistische Modelle bieten in dieser Hinsicht wertvolle Einblicke, da sie bislang unbekannte Zusammenhänge aufdecken und die einflussreichsten Wetter- und Klilmafaktoren identifizieren können. ... mehrDiese Faktoren stehen mit erheblichen Etragsverlusten in Verbindung und sind eng mit Enährungssicherheit sowie wirtschaftlicher Instabilität verknüpft. Die Interpretation, Leistungsfähigkeit und Belastbarkeit solcher Modelle können jedoch stark von der Definition der Wetter- und Klimaparameter sowie der Datenverfügbarkeit abhängen. In dieser Arbeit werden statistische Modelle verwendet, um die räumliche Variabilität von klimatischen Einflussfaktoren während der Vegetationsperiode in Europa im Zusammenhang mit abrupten Ertragsverlusten zu untersuchen. Die daraus gewonnenen Erkenntnisse dienen dazu, die häufigsten Einflussfaktoren in aktuellen und zukünftigen Klimaszenarien zu identifizieren.
Zunächst untersucht diese Arbeit, inwieweit die Definition von Variablen die Vorhersagegenauigkeit in der statistischen Modellierung verbessert. Die Analyse konzentriert sich ausschließlich auf abrupte Rückgänge der Silomaiserträge in Deutschland, die im weiteren Verlauf dieser Arbeit als „Ertragsschocks“ bezeichnet werden. Die Arbeit verwendet zwei statistische Modellierungsansätze: den Least Absolute Shrinkage and Selection Operator (LASSO), eine parametrische Methode, sowie Random Forest, eine nichtparametrische, auf maschinellem Lernen basierende Methode. Die Ergebnisse zeigen, dass bei der Anwendung von LASSO Modelle mit einer Kombination aus einfachen und komplexen Variablen eine bessere Vorhersagegenauigkeit aufweisen. Im Gegensatz dazu zeigt Random Forest keinen klaren Vorteil bei der Vorauswahl zwischen einfachen und komplexen Variablen. Random Forest ist in der Lage, nichtlineare Wechselwirkungen zwischen Prädiktoren und der Zielvariablen zu erfassen, was die Notwendigkeit komplexer Variablenformulierungen reduziert. Darüber hinaus deuten die Ergebnisse darauf hin, dass eine Kombination aus kalten Temperaturen im April sowie heißen und trockenen Bedingungen im Juli die Wahrscheinlichkeit eines Silomais-Ertragsschocks in Deutschland deutlich erhöht. Diese Erkenntnisse unterstützen die Entwicklung von Anpassungsstrategien wie verbesserte Bewässerungspraktiken und Anpassungen der Aussaattermine.
Darüber hinaus wird ein Ensemble von Random-Forest-Modellen implementiert, um die wichtigsten witterungs- und klimabedingten Einflussfaktoren während der Vegetationsperiode auf Ertragsschocks bei Mais und Winterweizen in verschiedenen europäischen Ländern zu identifizieren. Die Analyse konzentriert sich auf zentrale europäische Produktionsländer: Frankreich, Rumänien und Spanien für Mais sowie Frankreich, Deutschland, Polen, Rumänien, Spanien und das Vereinigte Königreich für Winterweizen. Verwendet wird der „Global Data of Historical Yields“ (GDHY)-Datensatz, ein globales, rasterbasiertes Ertragsdatensatz, das eine größere Stichprobengröße pro Land aufweist und so die Robustheit der entwickelten Modelle erhöht. Für jede Kombination aus Kulturpflanze und Land wird ein Ensemble von Random-Forest-Modellen angewendet, um unter stark variierenden klimatischen Bedingungen die wichtigsten Einflussfaktoren zu ermitteln. Die Ergebnisse zeigen eine ausgeprägte räumliche Variabilität der klimatischen Einflussfaktoren während der Vegetationsperiode auf Ertragsschocks bei Mais und Winterweizen. Bei Mais sind hohe Temperaturen und Trockenheit die Hauptauslöser in Frankreich und Rumänien, während in Spanien ein Mangel an Niederschlag im März als kritischster Faktor hervorgeht. Im Fall von Winterweizen werden, je nach Land, Ertragsschocks durch eine Vielzahl von Bedingungen während der Vegetationsperiode verursacht, darunter sowohl hohe als auch niedrige Temperaturen sowie extreme Niederschlagsereignisse. In Frankreich sind warme Wetterbedingungen im Dezember und April entscheidende Auslöser, während in Deutschland sowohl kalte als auch warme Temperaturanomalien im Dezember sowie erhöhte Temperaturen im Juni die Wahrscheinlichkeit von Ertragsschocks erhöhen. In Rumänien und Spanien wirken sich insbesondere trockene und heiße Frühjahrsbedingungen stark aus, während im Vereinigten Königreich starke Niederschlagsereignisse im Juni das Risiko von Winterweizen-Ertragsschocks deutlich erhöhen.
Abschließend wird der Einfluss der globalen Erwärmung auf Ertragsschocks untersucht. Die Thesis analysiert, wie zukünftige Klimawandelszenarien Ertragsschocks beeinflussen, basierend auf einer Reihe regionaler Klimamodelle des EURO-CORDEX-Projekts, gefolgt von einer Bias-Korrektur. Durch die Anwendung von Ertragsschock-Modellen auf Basis des heutigen Klimas werden die wichtigsten Einflussfaktoren zukünftiger Ertragsverluste identifiziert. Bei Mais zeigen sich nur schwache Trends und eine hohe Unsicherheit in den Projektionen, was auf geringe Übereinstimmung der Modelle hinsichtlich zukünftiger Niederschlagsmuster zurückzuführen ist. Dennoch bleiben unter Szenarien mit 2°C und 3°C Erwärmung trockenere Bedingungen der dominierende Treiber von Ertragsschocks. Im Gegensatz dazu zeigt Winterweizen ein klareres Signal, mit steigender Wahrscheinlichkeit von Ertragsschocks in Ländern wie Frankreich, Deutschland, Rumänien und Spanien, während in Polen und dem Vereinigten Königreich stabile oder rückläufige Risiken zu beobachten sind. Erwärmungstrends, die mit hoher Sicherheit prognostiziert werden, dürften insbesondere in Deutschland, Polen und Rumänien zu einer Abnahme kältebedingter Ertragsschocks führen. Gleichzeitig könnte diese Erwärmung jedoch die Winterverluste in Frankreich und Deutschland, insbesondere im Dezember, erhöhen und das Risiko im Frühjahr und Frühsommer in weiten Teilen Europas steigern. In Spanien und dem Vereinigten Königreich führen unsichere Niederschlagsprognosen zu nur geringen Veränderungen der durchschnittlichen Verlustwahrscheinlichkeiten.
Diese Arbeit zeigt, dass der Mehrwert durch die Verwendung einfacher und komplexer Variablen stark mit der Wahl der statistischen Methode verknüpft ist. Während parametrische Methoden wie LASSO und komplexe Variablen die Vorhersagefähigkeit des Modells verbessern können, sind sie bei flexibleren Ansätzen wie Random Forest möglicherweise nicht erforderlich. Die starke räumliche Variabilität klimatischer Einflussfaktoren im heutigen und zukünftigen Klima verdeutlicht die Notwendigkeit, Anpassungsstrategien spezifisch für jede Kulturpflanze und jedes Land zu entwickeln.
Abstract (englisch):
Extreme weather conditions have caused significant losses in the agricultural sector. This has been evident in several countries across Europe, where previously unseen weather and climate extremes have led to record declines in crop yields. In this context, stakeholders and policy makers require a deeper understanding of how weather and climate influence crop production in order to design effective, crop- and location-specific adaptation strategies. Statistical models offer valuable insights in this regard, as they can uncover previously unknown interactions and identify the most influential weather and climate drivers behind substantial yield reductions (factors closely linked to food insecurity and economic instability). ... mehrHowever, the interpretation, performance, and robustness of such models can vary significantly depending on the selection of weather and climate predictors, as well as data availability. This thesis employs statistical models that addresses the spatial variability of in-season climate drivers in Europe in the context of abrupt yield losses. The resulting insights are then used to identify the most frequent drivers in present and future climate scenarios.
First, this thesis investigates to what extent variable definition enhance predictability in statistical modeling. The first analysis focuses on abrupt drops in silage maize yield, referred to throughout this thesis as "yield shock", in Germany, and employs two statistical modelling approaches: the Least Absolute Shrinkage and Selection Operator (LASSO), a parametric-based method, and Random Forest, a non-parametric, machine learning-based method. Results show that when using LASSO, models that integrate both simple and complex variables demonstrate superior predictive skill. In contrast, Random Forest does not exhibit a clear advantage when pre-selecting between simple and complex variables. Random Forest can capture non-linear interactions between predictors and the target variable, reducing the necessity for complex variable formulations. Furthermore, the findings indicate that a combination of cold temperatures in April and hot, dry conditions in July significantly increases the likelihood of silage maize yield shock in Germany. These insights support the development of adaptation strategies such as improved irrigation practices and adjustments to planting dates.
In addition to this, an ensemble of Random Forest models is implemented to identify the most important in-season weather and climate drivers of maize and wheat yield shocks across European countries. The further analyses centers on key European maize and wheat producers: France, Romania, and Spain for maize, and France, Germany, Poland, Romania, Spain, and the UK for winter wheat. The Global Data of Historical Yields (GDHY), a global gridded crop data, is used, which provides a larger sample size per country and enhancing the robustness of the developed models. An ensemble of Random Forest is employed to individual crop-country domain to identify key drivers under highly variable climatic conditions for each case. The findings reveal pronounced spatial variability in the in-season climate drivers of maize and winter wheat yield shocks. For maize, high temperatures and dry conditions are the main triggers in France and Romania, while in Spain, a lack of precipitation in March emerges as the most critical factor. In the case of winter wheat, yield shocks are driven by a range of in-season conditions, including high and low temperatures as well as extremes in precipitation, depending on the country. In France, warm conditions in December and April are key triggers, whereas in Germany, both cold and warm temperatures in December, along with elevated temperatures in June, increase the likelihood of yield shocks. In Romania and Spain, dry and hot spring conditions are particularly influential, while in the UK, elevated precipitation events in June significantly raise the risk of losses.
Finally, the influence of global warming on yield shock is investigated. The study examines how future climate change scenarios influence yield shocks by using a suite of EUROCORDEX regional climate models, followed by bias correction through various adjustment techniques. By applying present-climate crop yield shock models, the analysis identifies key drivers of future yield losses. For maize, weak trends and higher uncertainty in projected losses stem from low model agreement on future precipitation patterns. Nonetheless, under 2°C and 3°C warmer climate scenarios, drier conditions persist as the dominant driver of yield shock. In contrast, winter wheat exhibits a clearer signal, with rising shock probabilities in countries such as France, Germany, Romania, and Spain, while Poland and the UK see stable or declining risks. Warming trends, projected with high confidence, are likely to reduce cold-related yield shocks, particularly in Germany, Poland, and Romania. However, this warming may increase winter losses in France and Germany, especially in December, and elevate spring and early summer risks across much of Europe. In Spain and the UK, uncertain precipitation projections lead to little change in average loss probabilities.
This thesis shows that the added value of using simple and complex variables is entangled with the statistical method chosen. While parametric methods like LASSO and complex variables can enhance the predictability skill of the model, they may not be necessary when considering more flexible approaches like Random Forest. The strong spatial variability of climate drivers in present and future reveals the necessity to implement adaptation strategies specifically for each crop and country.