Analisi delle precipitazioni intense sull’Italia negli ultimi cento-centoventi anni nel contesto dello studio statistico delle proprietà dirette e/o derivate dei vortici ciclonici che interessano tale area Preparazione di un nuovo database di serie pluviometriche giornaliere per l’Italia centro-settentrionale Napoli, 12 novembre 2007 Diana Cricchio, Maurizio Maugeri, Gianluca Lentini, Nicola Cortesi
Database originario 165 serie pluviometriche giornaliere per l’intero territorio italiano più due serie svizzere, raggruppate per fonte: Aeronautica Militare (AM), aggiornate al 2004; Secolari, da progetti di ricerca precedenti, Servizio Idrografico, SMI, …; Progetto Kyoto: 10 serie lombarde, 6 secolari e 4 cinquantennali (+ 2 serie brevi); UCEA, ENEL: serie lombarde < 50 anni. Tutte le serie sono non omogeneizzate; solo le secolari sono completate per piccoli buchi (solo su mesi aventi almeno un dato valido)
Controlli di qualità selezione / merging in caso di più serie di fonti diverse per la stessa località (es.: Como, Salò); controllo struttura e incolonnamento file; verifica corrispondenza n° giorni del mese – n° di dati; controllo non-negatività dei dati e valori outliers; verifica sequenze sospette di valori nulli (dati mancanti erroneamente registrati); controllo dati di longitudine, latitudine, quota 167 serie, di cui 110 di stazioni con lat. >= 43°
Controlli di consistenza 1.almeno 25 anni consecutivi (senza anni completamente mancanti) con non più del 20% di dati mancanti; 2.non più del 20% di dati mancanti sul periodo ; primo criterio meno restrittivo del secondo: solo 63 serie rispettano almeno il secondo criterio, 86 serie rispettano almeno il primo criterio
Distribuzione spaziale per fonti Secolari e AM: migliore copertura in numero e distribuzione spaziale; ENEL, UCEA, Progetto Kyoto: serie meno numerose, solo per la Lombardia; esigenza di recuperare nuove serie di buona qualità per le zone a minor copertura (es.: per il Nord-Est, serie di Trieste )
Estensione temporale delle serie circa 1/3 delle serie hanno durata nominale cinquantennale (serie AM e 4 serie del progetto Kyoto); circa 1/3 delle serie hanno durata nominale secolare (serie secolari e 6 serie del progetto Kyoto); le serie ENEL e UCEA sono più brevi (circa 25 anni).
massimo n° di serie disponibili nella seconda metà del 1900, con notevole crollo negli ultimi anni (da 63 serie per il 2000 a 19 serie per il 2004!); Copertura del territorio nel tempo
Suddivisione per quota 2/3 delle stazioni si trovano entro i 500m di quota:
Statistiche di base Programma “RainMaster” in Visual Basic for Applications (VBA) : controlli di qualità per serie giornaliere/mensili; statistiche sui dati mancanti; calcolo delle serie mensili, stagionali e annuali, anche in anomalie, con creazione dei relativi grafici; selezione delle serie in base a criteri geografici e di consistenza; creazione delle serie medie regionali, calcolo dell’intensità e delle frequenze di precipitazione sulla base dei percentili, analisi dei trend progressivi delle serie stagionali e annue
Suddivisione in macro-regioni mediante Principal Component Factor Analysis (PCFA) con il software STATISTICA per le 57 stazioni al di sotto dei 500m di quota; per il periodo di analisi ; sulle serie mensili per ciascuna stagione (inverno: dic, gen, feb) per eliminare il ciclo stagionale, trasformate in anomalie rispetto al periodo di riferimento ; verifica % dati mancanti su periodo di analisi e di riferimento; trattamento pairwise dei dati mancanti e rotazione Varimax; per l’estate: elevato numero di fattori a bassa varianza carattere locale delle precipitazioni estive per le stazioni sopra i 500m: minore n° di stazioni (29), difficile suddivisione…
isolinee dei factor loadings per le stazioni sotto i 500m - inverno zona alpinazona adriatica zona Nord-Ovest zona Pianura Padanazona Toscana
Criterio di selezione degli eventi intensi collocazione temporale dell’evento affetta da un errore di circa 12 ore passaggio dal singolo valore giornaliero al cumulativo su 2 giorni (assegnato al secondo giorno): instabilità dei risultati ottenuti in precedenza con la definizione di evento intenso sulla base dei percentili passaggio al cumulativo riportato al suo corrispondente valore “medio”: F i : cumulativo su 31 giorni centrato sul giorno i i: media climatologica di F i sul periodo : fit della curva i con smoothing a media mobile su finestre di 31 giorni per ridurne la rumorosità per ciascuna macro-regione, calcolo della media degli r i su tutte le stazioni della macro-regione per ogni giorno del periodo di analisi ordinamento eventi in base all’indicatore r i
Es: serie secolare di MILANO curva continua: medie climatologiche sul periodo dei valori giornalieri delle precipitazioni cumulative su 31 giorni ( i /31); curva *: fit a media mobile su finestre di 31 giorni. distribuzione degli r i su tutto il periodo nominale della serie
distribuzione della media degli r i su tutte le stazioni per il periodo ordinamento eventi in base a media r i decrescente: 15 eventi con media r i >= 10: (N.B.: analisi da condurre successivamente su ciascuna macro-regione…) Classificazione e visualizzazione degli eventi intensi
evento a media r i maggiore: alluvione di Firenze – novembre 1966
Vantaggi della visualizzazione su mappe: rapida identificazione di dati errati, ad es. in caso di discordanza tra stazioni vicine (città/aeroporto AM); verifica della collocazione temporale degli eventi, ad es. per gli eventi su più giorni consecutivi.
Altre analisi sugli eventi intensi Per le serie secolari completate per piccoli buchi: controllo eventi > 50 mm generati dall’algoritmo di completamento (individuati da 1 a 4 casi per 8 serie sulle 32 del database) Per l’individuazione di eventuali valori errati ed il controllo sulla collocazione degli eventi: per ciascun evento maggiore di una certa soglia, confronto tra le finestre di valori centrati sull’evento per gruppi di stazioni vicine
Problemi aperti omogeneizzazione??? completamento dei dati mancanti: individuazione di un sottogruppo di serie prive di dati mancanti, creazione di serie corrispondenti con eliminazione casuale di una fissata % di dati verifica della stabilità dei risultati valutazione della necessità di procedere al completamento…
Completamento dati mancanti e REGRESSIONE MULTIPLA CON RE-SCALING FASE I: Individuazione dei giorni piovosi Tutte le serie vengono convertite in serie di categorie di precipitazioni 0 = classe 0: giorno asciutto 1 = classe 1: P<50° percentile 2 = classe 2: 50°<P<75° 3 = classe 3: 75°<P<90° 4 = classe 4: 90°<P<95° 5 = classe 5: 95°<P<99° 6 = classe 6: P>99° La serie da completare viene ricalcolata interamente come media pesata delle serie di riferimento espresse in categorie (assumerà valori continui tra 0 e 6) In base ai dati disponibili (non mancanti) nella serie da completare si definisce, per ogni giorno dell’anno, la soglia secco/piovoso Quindi, nella serie ricostruita, i valori sopra tale soglia vengono classificati piovosi (1) e quelli sotto soglia vengono classificati secchi (0)
REGRESSIONE MULTIPLA CON RE-SCALING FASE II: Ricostruzione con la regressione multipla Tutti i giorni della serie da completare che sono stati classificati 1 nella fase I, vengono ricostruiti con una regressione multipla Il principale limite della regressione multipla risiede nella sua incapacità di preservare la distribuzione statistica originale
REGRESSIONE MULTIPLA CON RE-SCALING FASE III: Re-scaling della serie ricostruita