Enrichissement de prévisions d'ensemble à résolution kilométrique à l'aide de méthodes génératives
Brochet, Clément
Enriching kilometer-scale ensemble forecasts with generative methods
Auteur moral
Université Toulouse 3 Paul Sabatier : UT3
Auteur moral
Raynaud, Laure ; Plu, Matthieu
Année de publication
2024
La prévision d'ensemble est une évolution majeure de la prévision numérique du temps (PNT) sur les 30 dernières années. Elle permet d'estimer les incertitudes qui affectent les prévisions, en calculant plusieurs trajectoires (ou membres) possibles du système atmosphérique à partir de conditions initiales. Cependant, la grande sensibilité des équations de la physique à ces conditions initiales rend cette tâche très coûteuse. En effet, un grand nombre de membres est parfois nécessaire pour estimer correctement les probabilités d'occurrence d'événements météorologiques extrêmes. Les modèles de PNT régionaux atteignant des résolutions kilométriques, le nombre de membres calculable est limité à quelques dizaines. Savoir si des méthodes statistiques peuvent enrichir à moindre coût les prévisions fournies par les modèles de PNT 'traditionnels' à résolution kilométrique est donc une question ouverte. Les progrès rapides de l'apprentissage profond, en tant que technique efficace d'émulation de modèles de PNT, permettent d'envisager l'usage des réseaux de neurones génératifs dans ce but. Cette thèse cherche à appliquer ces méthodes au système de prévision d'ensemble à 16 membres PEARO, utilisé par Météo-France pour la prévision opérationnelle. Nous évaluons d'abord la capacité des GANs à émuler de façon aléatoire des champs de vent et de température issus de PEARO. Le réalisme physique de ces champs et les propriétés statistiques des distributions ainsi créées sont évalués par des métriques variées et complémentaires. Nous montrons, avec une architecture simple, que les GANs peuvent effectivement émuler les distributions de PEARO de façon satisfaisante, en termes de qualité et de diversité. Cependant, les données générées peuvent introduire certains biais dans l'entraînement, qui l'accélèrent, mais empêchent le GAN de reproduire complètement la distribution-cible. L'architecture StyleGAN-2, fortement régularisée, s'affranchit de cet obstacle. Nous l'adaptons donc pour générer des événements précipitants. Pour entraîner le GAN avec succès dans ce cadre, il faut prendre en compte la variabilité extrême des précipitations. Nous présentons une façon de contrôler cette variabilité, et montrons son intérêt pour construire une représentation latente de qualité au sein du générateur, utilisable pour conditionner la génération à une situation météorologique quelconque. Ensuite, nous présentons une méthode originale d'enrichissement des ensembles PEARO à l'aide de StyleGAN-2. La représentation latente du générateur permet de projeter les prévisions de PEARO dans un espace de basse dimension, où des perturbations linéaires des membres de PEARO sont utilisées pour créer de nouveaux membres. Cette méthode génère des membres réalistes et spécifiques de la situation météorologique considérée. A partir de 16 membres conditionneurs, les nouveaux ensembles peuvent notamment reproduire les extrêmes d'un ensemble AROME de 875 membres. En comparant ces nouveaux ensembles à des observations, cette méthode obtient des scores satisfaisants, en particulier pour l'estimation des occurrences d'événements extrêmes. Nous identifions également les facteurs qui restent à améliorer pour permettre un usage opérationnel. En comparant StyleGAN-2 avec des modèles diffusifs, nous montrons enfin qu'un modèle de débruitage diffusif génère des champs de qualité comparable à ceux d'un GAN. Nous utilisons ensuite ce modèle diffusif dans un algorithme de génération conditionnelle récemment proposé par la littérature : il peut alors enrichir les prévisions de PEARO, obtenant des scores aux observations très légèrement dégradés par rapport à la méthode utilisant StyleGAN-2. Les modèles génératifs peuvent ainsi émuler de façon convaincante les modèles de PNT à haute résolution, pour un faible coût de calcul. Néanmoins, ils font intervenir des compromis de performance et d'efficacité, qu'il faut contrôler pour faire de ces modèles des outils puissants de prévision.</div>
Texte intégral
Accès à la notice sur le site du portail documentaire de Météo-France