Abstract:
Im Bereich vieler sozio-ökonomischer Anwendungen ist es von enomer Wichtigkeit das Wetter auf einer Zeitskala von zwei bis vier Wochen imVoraus(subsaisonal) korrekt vorherzusagen. Leider ist die Vorher sagbarkeit, insbesondere von Extremwetter, auf diesen Zeitskalen sehr schwierig, da die Informationen aus den Anfangsbedingungen der numerischen Gleichungen, aus denen ein Wettermodell aufgebaut ist, graduell abnehmen. Deswegen stehen daten-getriebene Modelle als Alternative zu numerischen Wetter modellen zur Diskussion. Ziel dieser Arbeit ist die Verbesserung der Güte von Vorhersagen der 2-Meter Temperatur und des Auftre tens von Kältewellentagen im mitteleuropäischen Winter 14, 21 und 28 Tage im Voraus. ... mehrDer Hauptaspekt liegt dabei auf der Kombination von meteorologischem Sachverstand und daten-getriebenen Random Forest- (RF) Modellen, einer Art maschinellen Lernens. Diese Modelle werden einerseits eingesetzt um die Vorhersagegrößen direkt zu bestimmen, anderseits in einem Nachbereitungs-Kontext (Postproces sing). Im Falle ersteren werden anhand von meteorologischen Gesichtspunkten ausgewählte Prädiktoren genutzt, die auf Reanalyse-Daten beruhen. Im Falle letzteren werden die nachträglich vorhergesagten (re-vorhergesagten, reforecasted) Felder der subsaisonalen bis saisonalen (S2S) Re-Vorhersagen des Eu ropäischen Zentrum für Mittelfristige Wettervorhersage (ECMWF) verwendet. Die Vorhersagen beider Varianten werden für die Winter 2000/2001-2019/2020 mit einem klimatologischen Ensemble basie rend auf Beobachtungsdaten verglichen. Die Evaluation wird anhand von Vorhersagen der kompletten Verteilung der kontinuierlichen Werten mit dem kontinuierlichen Rank-Gütemaß (Continuous Ranked Probability Skill Score) vorgenommen und anhand von binären kategorischen Vorhersagen anhand des Brier Gütemaßes (Brier Skill Score). Im Falle der RF-Modelle die ausschließlich auf Reanalyse-Daten beruhen werden bessere Vorhersagen der 2-Meter Temperatur für 14, 21 und 28 Tage im Voraus erreicht verglichen mit dem klimatologischen Ensemble. Bezüglich des Auftretens von Kältewellentagen werden bessere Vorhersagen 14 und 21 Ta ge im Voraus erreicht. Daher sind diese Modelle eine geeignete Alternative zu einer klimatologischen Vorhersage auf der subsaisonalen Zeitskala. Desweiteren, hat die Anwendung der Shapley Additive Explanations, einer Methode um die für Vorhersagen relevanten Prädiktoren herauszufinden, gezeigt, dass diese RF-Modelle in der Lage sind physikalisch bekannte Muster in den Eingabedaten zu lernen, wie beispielsweise die Relevanz des Zustands des stratosphärischen Polarwirbels im Winter während einer starken Kältewelle. Obwohl gute Vorhersagen mit RF-Modellen, die nur auf Reanalyse-Daten beruhen, erreicht werden, so generieren RF-basierte Postprocessing-Modelle im Allgemeinen noch bessere Vorhersagen der 2-Meter Temperatur und des Auftretens von Kältewellentagen. Eine Impurity Based Feature Importance, eine Methode zur Bestimmung der wichtigsten Prädiktoren im Prozess des Lernens der Modelle, hat da bei gezeigt, dass vor allem die nachträglich vorhergesagt 2-Meter Temperatur und Prädiktoren, die den großskaligen atmosphärischen Fluss beschreiben, wichtig für die Vorhersagen der RF-basierten Postpro cessing Modelle sind. Eine einfache Postprocessing-Alternative zu den den RF-basierten Modellen ist die vorhersagedauer abhägige Korrektur des mittleren Fehlers (lead-time-dependent mean bias correction) der ECMWF S2S Re-Vorhersagen. Diese Methode verbessert die Vorhersage der unbearbeiteten ECMWF S2S Re- Vorher sagen für alle Vorhersagedauern. Wir zeigen, dass dieser Ansatz die beste Lösung für die Vorhersage von Kältewellentagen 14 und 21 Tage im Voraus ist. RF-basierte Postprocessing-Modelle erzielen die besten Vorhersagen der 2-meter Temperaturr 14, 21 und 28 Tage im Voraus sowie die besten Vorhersage der Kältewellentage 28 Tage im Voraus. Neben der Verbesserung der Vorhersagegüte demonstrieren wir den Nutzen von Wetterregimen (WR) um die Verlässlichkeit der Vorhersagen einzuschätzen. WR repräsentieren die großskalige Luftbewegung in der Troposphäre und besitzen daher eventuell nützliche Informationen über die subsaisonale Vorhersag berkeit mitteleuropäischen Wetters. Wir sehen, dass das WR, das beim Vorhersagestart vorherrschend war, die Vorhersagegüte beeinflusst und daher zur Einschätzung der Verlässlichkeit von Vorhersagen ge nutzt werden kann. Allerdings muss dies aufgrund der geringen Datenlage mit Vorsicht geschehen. Anhand des Beispiels der Vorhersagen von Kältewellentagen der mean bias corrected ECMWF S2S Re-Vorhersage mit einer Vorhersagedauer von 14 Tagen untersuchen wir mögliche Gründe für die Güteunterschiede der Vorhersagen abhängig von dem WR bei Initialisierung. Dabei konzentrieren wir uns speziell auf Vorhersagem die während einer blockierenden Wetterlage über Grönland (GL; charakteri siert durch ein Hochdrucksystem über Grönland) oder einer meridionalen Wetterlage über Skandinavian (ScTr; charakterisiert durch ein Tiefdrucksystem über Skandinavian) initialisiert werden, da diese signifikante Unterschiede in ihrer Güte zeigen. Vorhersagen, die während GL initialisiert werden, zeigen dabei das beste Brier-Gütemaß während Vorhersagen, die während ScTr initialisiert werden, das schlechteste Brier-Gütemaß aufweisen. Wir sehen, dass im Falle der Vorhersagen, die während GL initialisiert wer den, die WR-Abfolgen häufiger typischen klimatologischen Mustern während der Vorhersagezeit folgen als im Falle der Vorhersagen, die während ScTr gestartet werden. Daher sehen wir es als wahrscheinlich an, dass dies einer der Gründe für eine bessere Vorhersagegüte ist. Desweiteren analysieren wir, unabhängig vom WR das bei der Initialisierung der Vorhersagen vor herrscht, die WR-Abfolgen vor den am besten (schlechtesten) vorhergesagten Kältewellentagen der Win ter 2000/2001-2019/2020. Wir zeigen, dass die Vorhersagegüte signifikant höher ist, wenn eine blockie rende Wetterlage über Europa (charakterisiert durch ein Hochdrucksystem über den britischen Inseln und Süd-Skandinavien) in den Tagen vor dem Vorhersagedatum präsent ist. Unter der Annahme, dass eine entsprechend verlässliche Vorhersage der WRs existiert, kann dieses Ergebnis benutzt werden um die Verlässlichkeit der Vorhersagen von Kältewellen, die 14 Tage im Voraus vorhergesagt werden, ein zuschätzen. Die vorgestellte Arbeit zeigt das Potential von zeit- und kostengünstigen RF-Modellen für die Vorhersage der 2-Meter Temperatur und des Auftretens von Kältewellen in Mitteleuropa im Winter. Desweiteren wird die Nutzbarkeit von WR für die Einschätzung der Verlässlichkeit von Vorhersagen anhand einer Fallstudie demonstriert.
Abstract (englisch):
Skillful weather predictions on the subseasonal timescale (two to four weeks in advance) are crucial for many socio-economic applications. However, forecasting, especially extremes, on this timescale is very challenging as the information from initial conditions is gradually lost with increasing lead time. There fore, data-driven methods are discussed as a cost-efficient alternative or complement in a postprocessing sense to numerical weather predictions (NWPs). The aim of this research is to improve forecasts of wintertime 2-meter temperatures and the occurrence of cold-wave days in Central Europe at lead times of 14, 21 and 28 days. ... mehrThe main focus is thereby on the combination of meteorological knowledge and data-driven Random Forest (RF) models to either forecast these properties directly from predictors based on reanalysis fields or to use the RF models for postprocessing state-of-the-art NWPs. For those, European Centre for Medium-Range Weather Fore casts’s (ECMWF’s) Sub-seasonal to Seasonal (S2S) reforecasts are used. The (postprocessed) predic tions are compared for the winters 2000/2001-2019/2020 to a climatological benchmark ensemble based on observational data. The evaluation is performed as full distribution predictions for continuous values using the Continuous Ranked Probability Skill Score and as binary categorical forecasts using the Brier Skill Score. In case of the RF models based solely on reanalysis data, we achieve skillful forecasts of 2-meter tem peratures compared to the climatological benchmark ensemble on lead times of 14, 21 and 28 days. Concerning the occurrence of cold-wave days, skillful forecasts are obtained by the RF models for lead times of 14 and 21 days. Therefore, these models are a suitable alternative to using a climatological model for subseasonal predictions. Furthermore, the application of Shapley Additive Explanations suggests that the RF models are able to learn physically known relationships in the data, as e.g. the relevance of the state of the stratospheric polar vortex during a severe cold wave. In case of the RF-based postprocessing models, a higher skill for both the forecasts of 2-meter temper atures and the occurrence of cold-wave days is obtained compared to the predictions of the RF models based solely on reanalysis data. An Impurity Based Feature Importance reveals that especially the re forecasted 2-meter temperature and predictors representing the atmospheric large-scale flow are relevant for the models’ predictions. While the RF-based postprocessing models achieved the highest skill of the analyzed methods for the predictions of 2-meter temperatures at lead times of 14, 21 and 28 days and the predictions of the occur rence of cold-wave days at a lead time of 28 days, a simple lead-time-dependent mean bias correction of the original ECMWF’s S2S reforecasts achieves the highest skill for forecasts of the occurrence of cold wave days at lead times of 14 and 21 days. Furthermore, it improves the skill of the original ECMWF’s S2S reforecasts at all lead times. Besides improving forecast skill, we demonstrate the suitability of weather regimes (WRs) to assess forecast reliability. WRs represent the slowly varying, large-scale atmospheric background flow and therefore may contain relevant information about the subseasonal predictability of Central European weather. We find that the WR present at the initialization of the predictions influences the forecast skill and can therefore be used to assess forecast reliability. Nevertheless, due to a limited sample size, this has to be done with caution. With the example of the mean bias corrected 14-day reforecasts of ECMWF for the occurrence of cold wave days, we investigate possible reasons for the dependence of forecast skill on the WR present at initialization. Thereby, we specifically focus on reforecasts initialized during the WR Greenland Block ing (GL; characterized by a high pressure system over Greenland) and the WR Scandinavian Trough (ScTr; characterized by a low pressure system over Scandinavia) which show significant differences in their skill. In case of the reforecasts initialized during GL, which show a higher skill than reforecasts initialized during ScTr, we find WR successions which follow typical climatological patterns during the 14 days of forecasts more often. We suggest that this might be one of the main reasons for an increased forecast skill. Furthermore, we analyze the WR successions for the best and worst predicted days within the observed cold waves of the winters 2000/2001-2019/2020. This is done independent from the WR present at ini tialization. We find that forecast skill at a lead time of 14 days is significantly higher, when the European Blocking WR (characterized by a high pressure system over the British Isles and southern Scandinavia) is present a few days before the target date of the forecast. Given a reasonably good forecast of WRs, this result can be used to assess the reliability of cold-wave day predictions. The research presented in this thesis shows the potential of cost- and time-efficient RF models for both forecasting wintertime 2-meter temperatures and the occurrence of cold-wave days as well as postpro cessing existing NWPs of these. Furthermore the suitability of WRs in assessing forecast reliability is demonstrated on the basis of a case study.