Accueil du site
Master
Italie
Multi-task feature selection for drought monitoring : a conditional mutual information approach
Titre : Multi-task feature selection for drought monitoring : a conditional mutual information approach
Auteur : Nardi, Lorenzo
Université de soutenance : Politecnico di Milano
Grade : Tesi di laurea Magistrale 2022
Résumé
Il tema del cambiamento climatico è uno dei principali argomenti di discussione degli ultimi anni, visti gli effetti sugli ecosistemi che minacciano il futuro delle prossime generazioni. L’innalzamento delle temperature, principalmente guidato dal crescente bisogno di risorse da parte dell’uomo, ha incrementato la frequenza di periodi di siccità. Questo fenomeno è tipicamente associato alla mancanza d’acqua e contribuisce alla riduzione dei terreni per la coltivazione del cibo, con notevoli conseguenze economiche e sociali. In letteratura sono stati proposti diversi studi per studiare e monitorare il fenomeno della siccità attraverso indici calcolati da dati telerilevati. Tra questi, il Normalized Difference Vegetation Index (NDVI) è stato ampiamente adottato in diverse tecniche di Machine Learning per il monitoraggio e la previsione dei periodi di siccità. In particolare, questa tesi si propone di progredire il framework FRIDA (FRamework for Index-based Drought Analysis) per il monitoraggio degli eventi di siccità su una scala geografica più ampia, impiegando una selezione multivariata delle variabili basata sui concetti della teoria dell’informazione e sul paradigma del Multi-Task Learning. L’approccio proposto seleziona il sottoinsieme più informativo di features climatologiche da sottoregioni che differiscono per caratteristiche geografiche e demografiche, ma le cui condizioni di siccità potrebbero dipendere da fattori correlati. Le classi di modelli di apprendimento scelte utilizzano le variabili selezionate per produrre risultati in due contesti diversi : la ricostruzione dell’indice di siccità in un problema di regressione ; il monitoraggio delle condizioni del suolo coltivabile utilizzando un approccio di classificazione. L’analisi del primo problema di regressione ha mostrato che un modello autoregressivo ottiene risultati migliori rispetto a quelli impiegati, che invece utilizzano esclusivamente le variabili scelte ; nel caso della classificazione, i modelli Multi-Task dimostrano prestazioni soddisfacenti, considerando le limitazioni imposte dagli input rumorosi e dalla scarsità di dati per la fase di addestramento.
Page publiée le 7 février 2023