Analisi delle precipitazioni intense sull’Italia negli ultimi cento-centoventi anni nel contesto dello studio statistico delle proprietà dirette e/o derivate.

Slides:



Advertisements
Presentazioni simili
ALLEGATO 1 CRITERI PER LA VALUTAZIONE DELL'IMPORTANZA DELLE
Advertisements

Alcuni aspetti chiave e preliminari:
IDROLOGIA.
La chiusura del dataset 2008: scadenze e procedure Gianluigi Ferrante - Valentina Minardi 6 Febbraio 2009 Istituto Superiore di Sanità
Pierangelo Degano, Emanuel Castellarin, Laura Passaponti
Descrizione dei dati Metodi di descrizione dei dati
Gli errori nell’analisi statistica
C – Indici di Asimmetria e Curtosi
3. Processi Stocastici Un processo stocastico è una funzione del tempo i cui valori x(t) ad ogni istante di tempo t sono v.a. Notazione: X : insieme di.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
REELAZIONI CLIMATICHE
Portate di piena Celada Chiara Matricola:
ALBERI DECISIONALI prima parte
Previsione del carico Quando si parla di previsione del carico si intende il fabbisogno futuro di energia (e di potenza) dell’utenza finale. Il fabbisogno.
Analisi delle corrispondenze
1 Progetto Finalizzato CLIMAGRI II° Workshop Cambiamenti climatici e agricoltura Roma, 3-4 Aprile 2003 Monitoraggio della siccità e dei processi di desertificazione.
Progetto finalizzato MiPAF CLIMAGRI Cambiamenti climatici e agricoltura Bologna, 15 maggio 2006 Coordinatore: Dott. Domenico Vento Consiglio per la Ricerca.
Previsioni stagionali per l’agricoltura e l’ambiente
Il clima del Mediterraneo e la sua potenziale previsione Gruppo G3 Dipartimento di Fisica, Università di Roma La Sapienza.
Intelligenza Artificiale Algoritmi Genetici
Cai Lin Lin Michela & Guidetti Emanuela presentano:
METODI E CONTROLLI STATISTICI DI PROCESSO
PROGETTO Aggiornamento anno 2004 Cinzia Alessandrini ARPA – SIM Mirco Martina Studente I.T.I.S. O.Belluzzi.
Ordine degli Ingegneri di Bologna, 26 novembre 2010 Ordine degli Ingegneri di Bologna, 26 novembre /22 Gabriele Tonelli consulente CNR IRPI
Gestimp IV Il pacchetto software GESTIMP© di Isea S.r.l., di seguito indicato con GESTIMP©, permette di gestire la supervisione e la telegestione di impianti.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
GRANDEZZE ANALOGICHE E DIGITALI
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
Statistica economica (6 CFU)
Le rappresentazioni grafiche
Project Management La programmazione della produzione Ing
STATISTICA PER LE DECISIONI DI MARKETING
Limiti della sperimentazione in ambito educativo Su che cosa è possibile condurre un esperimento Limiti di carattere etico (Visalberghi) Fattori che possono.
Nubi: masse di vapore acqueo parzialmente condensato o
Capitolo 3 (parte seconda)
Nuclei fondanti della disciplina storia
Informatica B Matlab Laboratorio del 17/12/2013
CREAZIONE DI UNO STRUMENTO DI ANALISI A SUPPORTO DELLA DEFINIZIONE DI UNA RETE NAZIONALE DI QUALITÀ DELL’ARIA STATO DI AVANZAMENTO LAVORI 24 novembre 2006.
Statistica La statistica è
Le rappresentazioni grafiche
L’INDICATORE DI ATTIVITÀ ECONOMICA REGIONALE PER LA STIMA DEGLI EFFETTI ECONOMICI DEI TERREMOTI Cristina Brasili Dipartimento di Statistica “P. Fortunati”
Accenni di analisi monovariata e bivariata
Strumenti statistici in Excell
Il residuo nella predizione
1 L11c Un’applicazione: il bacino imbrifero del Lario Rodolfo Soncini Sessa MODSS Copyright 2004 © Rodolfo Soncini Sessa.
COFIN 2006 Unità di Camerino. STATISTICA e DINAMICA dei VORTICI ATMOSFERICI Mobilità Energetica Genesi ed Evoluzione Osservazioni Modelli ad area limitata.
NiXuS srl1 Training Galco Italia 22 Gennaio 2000 pMeter Software per l’analisi delle performance aziendali. N I X U S srl Via G. Scarabelli Roma,
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
CRONOPROGRAMMA Il cronoprogramma è un documento che rappresenta l'andamento nel tempo degli importi dei lavori da eseguire. Il finale di questo studio.
Gli strumenti operativi per l’economia aziendale
Elaborazione dei valori di fondo nelle acque sotterranee del SIN laguna di Marano e Grado Dr. A. Felluga ARPA FVG - Laboratorio di Udine 27 giugno 2013.
Il cambiamento climatico parte prima
Riassunto della prima lezione
TRATTAMENTO STATISTICO DEI DATI ANALITICI
EPG di Metodologia della ricerca e Tecniche Multivariate dei dati A.A
Tecniche di Gestione della Qualità Prof. Alessandro Ruggieri Prof. Enrico Mosconi A.A
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Collegio Maestri di sci Trento – Corso maggio 2016 LIVELLI ATMOSFERICI E CASI DI MALTEMPO. INTERNET.
Interazione Persona Computer prova di progetto Gruppo: IO Componenti: Carlo Solimando Sito analizzato:
Modellizzazione di cabine di trasformazione MT/bt in ambiente esterno Roma - ISPRA 9 Novembre 2011 Corso di formazione ambientale “Introduzione all’utilizzo.
I “FERRI DEL MESTIERE”: ALCUNI STRUMENTI ANALITICI PER LA STORIA ECONOMICA LM 84, Corso di Storia Economica 2015/16.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Campionamento.
Campionamento procedimento attraverso il quale si estrae, da un insieme di unità (popolazione) costituenti l’oggetto delle studio, un numero ridotto di.
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
ARGOMENTI DELLA LEZIONE  Le distribuzioni di frequenza in classi  Le distribuzioni di frequenza in classi  Le tabelle di frequenza  La rappresentazione.
1. Metodi oggettivi: Posso inserire una tabella di valori (tempo, misurazione) o un vettore da trasformare in una matrice Le caselle indicano quanti passaggi.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Transcript della presentazione:

Analisi delle precipitazioni intense sull’Italia negli ultimi cento-centoventi anni nel contesto dello studio statistico delle proprietà dirette e/o derivate dei vortici ciclonici che interessano tale area Preparazione di un nuovo database di serie pluviometriche giornaliere per l’Italia centro-settentrionale Napoli, 12 novembre 2007 Diana Cricchio, Maurizio Maugeri, Gianluca Lentini, Nicola Cortesi

Database originario 165 serie pluviometriche giornaliere per l’intero territorio italiano più due serie svizzere, raggruppate per fonte: Aeronautica Militare (AM), aggiornate al 2004; Secolari, da progetti di ricerca precedenti, Servizio Idrografico, SMI, …; Progetto Kyoto: 10 serie lombarde, 6 secolari e 4 cinquantennali (+ 2 serie brevi); UCEA, ENEL: serie lombarde < 50 anni. Tutte le serie sono non omogeneizzate; solo le secolari sono completate per piccoli buchi (solo su mesi aventi almeno un dato valido)

Controlli di qualità selezione / merging in caso di più serie di fonti diverse per la stessa località (es.: Como, Salò); controllo struttura e incolonnamento file; verifica corrispondenza n° giorni del mese – n° di dati; controllo non-negatività dei dati e valori outliers; verifica sequenze sospette di valori nulli (dati mancanti erroneamente registrati); controllo dati di longitudine, latitudine, quota  167 serie, di cui 110 di stazioni con lat. >= 43°

Controlli di consistenza 1.almeno 25 anni consecutivi (senza anni completamente mancanti) con non più del 20% di dati mancanti; 2.non più del 20% di dati mancanti sul periodo ; primo criterio meno restrittivo del secondo: solo 63 serie rispettano almeno il secondo criterio, 86 serie rispettano almeno il primo criterio

Distribuzione spaziale per fonti Secolari e AM: migliore copertura in numero e distribuzione spaziale; ENEL, UCEA, Progetto Kyoto: serie meno numerose, solo per la Lombardia;  esigenza di recuperare nuove serie di buona qualità per le zone a minor copertura (es.: per il Nord-Est, serie di Trieste )

Estensione temporale delle serie circa 1/3 delle serie hanno durata nominale cinquantennale (serie AM e 4 serie del progetto Kyoto); circa 1/3 delle serie hanno durata nominale secolare (serie secolari e 6 serie del progetto Kyoto); le serie ENEL e UCEA sono più brevi (circa 25 anni).

massimo n° di serie disponibili nella seconda metà del 1900, con notevole crollo negli ultimi anni (da 63 serie per il 2000 a 19 serie per il 2004!); Copertura del territorio nel tempo

Suddivisione per quota 2/3 delle stazioni si trovano entro i 500m di quota:

Statistiche di base Programma “RainMaster” in Visual Basic for Applications (VBA) : controlli di qualità per serie giornaliere/mensili; statistiche sui dati mancanti; calcolo delle serie mensili, stagionali e annuali, anche in anomalie, con creazione dei relativi grafici; selezione delle serie in base a criteri geografici e di consistenza; creazione delle serie medie regionali, calcolo dell’intensità e delle frequenze di precipitazione sulla base dei percentili, analisi dei trend progressivi delle serie stagionali e annue

Suddivisione in macro-regioni mediante Principal Component Factor Analysis (PCFA) con il software STATISTICA per le 57 stazioni al di sotto dei 500m di quota; per il periodo di analisi ; sulle serie mensili per ciascuna stagione (inverno: dic, gen, feb) per eliminare il ciclo stagionale, trasformate in anomalie rispetto al periodo di riferimento ; verifica % dati mancanti su periodo di analisi e di riferimento; trattamento pairwise dei dati mancanti e rotazione Varimax; per l’estate: elevato numero di fattori a bassa varianza  carattere locale delle precipitazioni estive per le stazioni sopra i 500m: minore n° di stazioni (29), difficile suddivisione…

isolinee dei factor loadings per le stazioni sotto i 500m - inverno zona alpinazona adriatica zona Nord-Ovest zona Pianura Padanazona Toscana

Criterio di selezione degli eventi intensi collocazione temporale dell’evento affetta da un errore di circa 12 ore  passaggio dal singolo valore giornaliero al cumulativo su 2 giorni (assegnato al secondo giorno): instabilità dei risultati ottenuti in precedenza con la definizione di evento intenso sulla base dei percentili  passaggio al cumulativo riportato al suo corrispondente valore “medio”: F i : cumulativo su 31 giorni centrato sul giorno i i: media climatologica di F i sul periodo : fit della curva i con smoothing a media mobile su finestre di 31 giorni per ridurne la rumorosità per ciascuna macro-regione, calcolo della media degli r i su tutte le stazioni della macro-regione per ogni giorno del periodo di analisi  ordinamento eventi in base all’indicatore r i

Es: serie secolare di MILANO curva continua: medie climatologiche sul periodo dei valori giornalieri delle precipitazioni cumulative su 31 giorni ( i /31); curva *: fit a media mobile su finestre di 31 giorni. distribuzione degli r i su tutto il periodo nominale della serie

distribuzione della media degli r i su tutte le stazioni per il periodo ordinamento eventi in base a media r i decrescente: 15 eventi con media r i >= 10: (N.B.: analisi da condurre successivamente su ciascuna macro-regione…) Classificazione e visualizzazione degli eventi intensi

evento a media r i maggiore: alluvione di Firenze – novembre 1966

Vantaggi della visualizzazione su mappe: rapida identificazione di dati errati, ad es. in caso di discordanza tra stazioni vicine (città/aeroporto AM); verifica della collocazione temporale degli eventi, ad es. per gli eventi su più giorni consecutivi.

Altre analisi sugli eventi intensi Per le serie secolari completate per piccoli buchi: controllo eventi > 50 mm generati dall’algoritmo di completamento (individuati da 1 a 4 casi per 8 serie sulle 32 del database) Per l’individuazione di eventuali valori errati ed il controllo sulla collocazione degli eventi: per ciascun evento maggiore di una certa soglia, confronto tra le finestre di valori centrati sull’evento per gruppi di stazioni vicine

Problemi aperti omogeneizzazione??? completamento dei dati mancanti: individuazione di un sottogruppo di serie prive di dati mancanti, creazione di serie corrispondenti con eliminazione casuale di una fissata % di dati  verifica della stabilità dei risultati  valutazione della necessità di procedere al completamento…

Completamento dati mancanti e REGRESSIONE MULTIPLA CON RE-SCALING FASE I: Individuazione dei giorni piovosi Tutte le serie vengono convertite in serie di categorie di precipitazioni 0 = classe 0: giorno asciutto 1 = classe 1: P<50° percentile 2 = classe 2: 50°<P<75° 3 = classe 3: 75°<P<90° 4 = classe 4: 90°<P<95° 5 = classe 5: 95°<P<99° 6 = classe 6: P>99° La serie da completare viene ricalcolata interamente come media pesata delle serie di riferimento espresse in categorie (assumerà valori continui tra 0 e 6) In base ai dati disponibili (non mancanti) nella serie da completare si definisce, per ogni giorno dell’anno, la soglia secco/piovoso Quindi, nella serie ricostruita, i valori sopra tale soglia vengono classificati piovosi (1) e quelli sotto soglia vengono classificati secchi (0)

REGRESSIONE MULTIPLA CON RE-SCALING FASE II: Ricostruzione con la regressione multipla Tutti i giorni della serie da completare che sono stati classificati 1 nella fase I, vengono ricostruiti con una regressione multipla Il principale limite della regressione multipla risiede nella sua incapacità di preservare la distribuzione statistica originale

REGRESSIONE MULTIPLA CON RE-SCALING FASE III: Re-scaling della serie ricostruita