Abstract:
Aerosole sind winzige feste oder flüssige Partikel, die in der Atmosphäre suspendiert sind. In städtischen Gebieten sind hohe Aerosolkonzentrationen eng mit Atemwegserkrankungen, Herz-Kreislauf-Problemen und einem allgemeinen Rückgang der öffentlichen Gesundheit verbunden. Angesichts ihrer erheblichen Auswirkungen ist die Entwicklung eines hochauflösenden Vorhersagesystems für die städtische Aerosolverteilung entscheidend, um umweltpolitische Entscheidungen zu unterstützen, die öffentliche Gesundheit zu schützen und die Stadtplanung zu optimieren.
Die Beobachtung der Aerosolverteilung basiert auf zwei Hauptansätzen: Fernerkundung und in-situ Sensornetzwerke. ... mehrWährend Fernerkundungstechniken eine großflächige Abdeckung ermöglichen, weisen sie erhebliche Einschränkungen auf, wie z. B. eine unzureichende räumliche Auflösung, lange Wiederholungsintervalle und eine Anfälligkeit für Hindernis. Diese Einschränkungen machen die Fernerkundung für die Echtzeit- und hochauflösende Überwachung städtischer Aerosole ungeeignet. Infolgedessen bleiben in-situ Sensornetzwerke, die direkte und kontinuierliche Messungen liefern, die primäre Methode zur Beobachtung der städtischen Aerosolverteilung. Trotz ihrer Vorteile stehen jedoch auch in-situ Sensornetzwerke vor Herausforderungen, darunter eine ungleichmäßige räumliche Abdeckung, Probleme mit der Datenzuverlässigkeit und Wartungsaufwand.
Das Herzstück eines Vorhersagesystems für die städtische Aerosolverteilung liegt in spatiotemporalen Datenanalysemodellen, die grob in physikgetriebene und datengetriebene Ansätze unterteilt werden können. Physikgetriebene Modelle basieren auf etablierten atmosphärischen Transportgleichungen und chemischen Reaktionsmechanismen, was sie interpretierbar und theoretisch robust macht. Allerdings erfordern sie oft rechenaufwendige Berechnungen während der Inferenz, und ihre Genauigkeit in hochauflösenden Vorhersagen hängt stark von umfassenden und hochpräzisen Eingabedaten ab, darunter Landnutzung, Verkehrsemissionen und verschiedene meteorologische Parameter. Aufgrund technischer, finanzieller und administrativer Einschränkungen liefern in-situ Sensornetzwerke jedoch oft nicht die erforderliche Datenqualität und -abdeckung, was dazu führt, dass physikgetriebene Modelle entweder nicht funktionieren oder unzuverlässige Ergebnisse liefern. Angesichts dieser Einschränkungen gewinnen datengetriebene Ansätze zunehmend an Bedeutung. Im Gegensatz zu physikgetriebenen Modellen extrahieren datengetriebene Methoden statistische Muster aus vorhandenen Beobachtungen und sind dadurch anpassungsfähiger an unvollständige und ungenaue Datensätze.
Trotz ihrer besseren Anpassungsfähigkeit stehen datengetriebene Methoden zur Vorhersage der städtischen Aerosolverteilung weiterhin vor erheblichen Herausforderungen. Die Hauptprobleme resultieren aus der Heterogenität und dem Rauschen in den Daten der in-situ Sensornetzwerke. Weitere Faktoren, wie unausgewogene Merkmals- und Labelverteilungen sowie unvollständige Muster, erschweren die Aufgabe zusätzlich. Diese Dissertation untersucht verschiedene Ansätze zur Bewältigung dieser Herausforderungen, indem sie unvollständige Daten nutzt, um ein effektiveres spatiotemporales Analysemodell zur Vorhersage der städtischen Aerosolverteilung zu entwickeln.
Wir untersuchen Datenaugmentierungsstrategien, um die Herausforderungen defekter und begrenzter Daten zu bewältigen. Allerdings sind Datenaugmentierungsmethoden für die städtische Aerosolverteilung aufgrund der Komplexität der Umweltdynamik stark eingeschränkt. Daher untersuchen wir die Verwendung von Computational Fluid Dynamics (CFD)-Simulationen zur Generierung synthetischer Daten. Obwohl CFD-Simulationen zuverlässige synthetische Aerosolverteilungsdaten liefern können, sind ihre Rechenkosten extrem hoch, was sie für die Unterstützung großflächiger Datensätze, die für maschinelle Lernmodelle erforderlich sind, unpraktikabel macht. Um dieses Problem zu lösen, haben wir ein Graph Neural Network (GNN)-basiertes CFD-Surrogatmodell entwickelt, das die Datengenerierung erheblich beschleunigt.
Im Bereich der spatiotemporalen Modellierung verwenden wir eine "Divide-and-Conquer"-Strategie, um zeitliche und räumliche Korrelationen getrennt zu analysieren, Fehlzuweisungen zu reduzieren und die Vorhersagegenauigkeit zu verbessern. Zur Modellierung zeitlicher Korrelationen entwickeln wir ein Neural Kernel Network (NKN)-basiertes Gaussian Process Regression (GPR)-Modell. Dieses Modell nutzt GPR, um langfristige zeitliche Abhängigkeiten zu erfassen und Unsicherheiten zu quantifizieren, während der NKN-Kernel das Problem der manuellen Definition geeigneter Kernelfunktionen für komplexe Systeme überwindet. Zur Modellierung räumlicher Korrelationen schlagen wir drei spezialisierte Module vor, die unterschiedliche Herausforderungen bewältigen. Das Context Encoder Spatial Interpolation (CESI)-Modell wurde entwickelt, um heterogene Sensordaten durch effektives Mining spärlicher Eingaben zu verarbeiten. Das Information Segmentation Spatial Interpolation (ISSI)-Modell nutzt selbstüberwachtes Lernen, um Unsicherheiten zu verringern, die aus nicht beobachteter Latent Context Information in Sensornetzwerken entstehen. Schließlich adressiert das Feature Deviation Embedding Graph Spatial Interpolation (FDE-GSI)-Modell Merkmalsungleichgewichte, indem es Feature Deviation Embedding und einen adaptiven Informations-Engpass-Mechanismus implementiert.
Unsere vorgeschlagenen Modelle werden anhand mehrerer realer Datensätze evaluiert, wobei sie ihre Genauigkeit, Robustheit und Anpassungsfähigkeit unter Beweis stellen. Im Gegensatz zu bestehenden Modellen, die starke Leistungsfluktuationen über verschiedene Datensätze hinweg zeigen, erreichen unsere Modelle durchgängig State-of-the-Art-Leistungen. Diese Stabilität unterstreicht die Wirksamkeit unserer Designentscheidungen und ihr Potenzial für praktische Anwendungen.
Zusammenfassend befasst sich diese Dissertation mit der Herausforderung, die hochauflösende städtische Aerosolverteilung mithilfe heterogener und unsicherer Datenquellen vorherzusagen. Durch eine systematische Analyse der Einschränkungen bestehender Beobachtungsmethoden und Vorhersagemodelle schlagen wir eine Reihe von Innovationen vor, darunter CFD-basierte Datenaugmentierung, GNN-basierte CFD-Surrogatmodellierung und spezialisierte spatiotemporale Analysemodelle. Unsere Modelle bewältigen zentrale Herausforderungen wie Datenheterogenität, Unsicherheit und Merkmalsungleichgewicht und erreichen State-of-the-Art-Leistungen auf mehreren realen Datensätzen. Diese Arbeit leistet einen bedeutenden Beitrag zur städtischen Umweltmodellierung und bietet skalierbare und robuste Lösungen zur Aerosolverteilungsvorhersage in komplexen städtischen Umgebungen.
Abstract (englisch):
Aerosols are tiny solid or liquid particles suspended in the atmosphere. In urban areas, high concentrations of aerosols are closely associated with respiratory diseases, cardiovascular issues, and overall declines in public health. Given their significant implications, designing a fine-grained urban aerosol distribution prediction system is essential for aiding environmental policymaking, protecting public health, and guiding urban planning.
Observing aerosol distribution depends on two main approaches: remote sensing and in-situ sensor networks. While remote sensing techniques offer extensive spatial coverage, they have significant limitations, such as insufficient spatial resolution, long revisit intervals, and occlusion vulnerability. ... mehrThese limitations render remote sensing unsuitable for real-time and high-resolution monitoring of urban aerosols. As a result, in-situ sensor networks, which provide direct and continuous measurements, continue to be the primary method for observing urban aerosol distribution. However, in-situ sensor networks also encounter challenges despite their benefits, including uneven spatial coverage, data reliability issues, and maintenance constraints.
The core of an urban aerosol distribution prediction system lies in spatiotemporal data analysis models that can be broadly classified into physics-driven and data-driven approaches. Physics-driven models rely on well-established atmospheric transport equations and chemical reaction mechanisms, which makes them interpretable and theoretically robust. However, they often involve expensive calculations during inference, and their effectiveness in fine-grained predictions heavily relies on comprehensive and highly accurate input data, including but not limited to land use, traffic emissions, and various meteorological parameters. Unfortunately, in-situ sensor networks often fail to provide data with the necessary breadth and quality due to technical, financial, and administrative constraints, resulting in models that cannot function or produce unreliable outputs. Given these limitations, data-driven approaches are increasingly preferred. Unlike physics-driven models, data-driven methods extract statistical patterns from available observations, making them more adaptable to incomplete and imperfect datasets.
Despite the better adaptability of data-driven methods, predicting urban aerosol distribution still encounters significant challenges. The main difficulties arise from the heterogeneity and noise in in-situ sensor network data. Additional factors, such as the unbalanced distributions of features and labels and the incompleteness of patterns, further complicate the task. This dissertation explores various approaches to address these challenges, utilizing imperfect data to develop a more effective spatiotemporal analysis model for urban aerosol distribution prediction.
We explore data augmentation strategies to tackle the challenges of defective and limited data. However, data augmentation methods for urban aerosol distribution are significantly constrained due to the complexity of environmental dynamics. We explore using Computational Fluid Dynamics (CFD) simulations to generate synthetic data. While CFD simulations can yield reliable synthetic aerosol distribution data, their computational costs are prohibitively high, rendering them impractical for supporting the large-scale datasets needed for machine learning models. We, therefore, developed a graph neural network-based CFD surrogate model to address this limitation, significantly accelerating data generation.
Regarding spatiotemporal modeling, we utilize a "divide-and-conquer" strategy to address temporal and spatial correlations separately, reducing misattribution and improving predictive accuracy. We develop a Neural Kernel Network (NKN)-based Gaussian Process Regression (GPR) model to capture temporal correlations. This model leverages GPR to capture long-range temporal dependencies and quantify uncertainty while employing the NKN kernel to overcome the challenge of designing appropriate kernel functions without prior knowledge of the complex underlying system. For spatial correlations, we propose three specialized modules to tackle distinct challenges. The Context Encoder Spatial Interpolation (CESI) model is crafted to manage heterogeneous sensor data by effectively mining sparse inputs. The Information Segmentation Spatial Interpolation (ISSI) model utilizes self-supervised learning to alleviate uncertainties that arise from unobserved Latent Context Information in sensor networks. Lastly, the Feature Deviation Embedding Graph Spatial Interpolation (FDE-GSI) model addresses feature imbalance by implementing Feature Deviation Embedding and an adaptive information bottleneck mechanism.
We evaluate our proposed models using multiple real-world datasets, demonstrating their accuracy, robustness, and adaptability. Unlike existing models that show significant performance fluctuations across datasets, our models consistently achieve state-of-the-art performance. This stability highlights the effectiveness of our design choices and the potential for application deployments.
In summary, this dissertation tackles the critical challenge of predicting fine-grained urban aerosol distribution using heterogeneous and uncertain data sources. By systematically analyzing the limitations of existing observational methods and prediction frameworks, we propose a series of innovations, including CFD-based data augmentation, GNN-based CFD surrogate modeling, and a suite of specialized temporal and spatial analysis models. Our models effectively address key challenges such as data heterogeneity, uncertainty, and feature imbalance, achieving state-of-the-art performance across multiple real-world datasets. This work advances the field of urban environmental modeling, providing scalable and robust solutions for aerosol distribution prediction in complex urban environments.