Reti Neurali nella previsione di variabili ambientali

Slides:



Advertisements
Presentazioni simili
IDL routine for Hot-Spot detection and effusion rate estimation
Advertisements

Centro Internazionale per gli Antiparassitari e la Prevenzione Sanitaria Azienda Ospedaliera Luigi Sacco - Milano WP4: Cumulative Assessment Group refinement.
I numeri, l’ora, I giorni della settimana
L’esperienza di un valutatore nell’ambito del VII FP Valter Sergo
Weather and water monitoring in the Po Basin - forecasts, modeling and organization for the defense against river floods . Astrakhan, 19 th – 20th April.
Cache Memory Prof. G. Nicosia University of Catania
1 12 aprile 2005 Approximate Dynamic Factor Models: sviluppi della teoria e applicazioni – parte prima Andrea Brasili Strategie e Studi – UniCredit Banca.
Teoria e Tecniche del Riconoscimento
Parametri Acustici (ISO 3382)
1 Teaching Cloud Computing and Windows Azure in Academia Domenico Talia UNIVERSITA DELLA CALABRIA & ICAR-CNR Italy Faculty Days 2010.
A. Oppio, S. Mattia, A. Pandolfi, M. Ghellere ERES Conference 2010 Università Commerciale Luigi Bocconi Milan, june 2010 A Multidimensional and Participatory.
EBRCN General Meeting, Paris, 28-29/11/20021 WP4 Analysis of non-EBRCN databases and network services of interest to BRCs Current status Paolo Romano Questa.
DG Ricerca Ambientale e Sviluppo FIRMS' FUNDING SCHEMES AND ENVIRONMENTAL PURPOSES IN THE EU STRUCTURAL FUNDS (Monitoring of environmental firms funding.
HBEFA - Handbook Emission Factors for Road Transport
Udine 1 Udine – Richieste Attivamente coinvolti totali 3FTE M.P.Giordani, P.Palestri, L.Selmi A.Micelli (dottorando) A.Cristofoli (laureando.
DEE -Politecnico di Bari Unità del Politecnico di Bari Sintesi e ottimizzazione energetica di protocolli di acceso e trasporto in reti wireless multihop.
Cancer Pain Management Guidelines
A. Nuzzo U.O. di Oncologia Medica ospedale Renzetti di Lanciano (CH)
Stima del contributo sahariano sullItalia nel periodo state of the art- ENEA MEETING, 3 rd -5 th March 2010 A.Pederzoli, M. Mircea, G. Zanini,
Che ore è? Che ore Sono?.
1 Ricerca del bosone di Higgs nel canale di decadimento WW (*) 2l2 nel canale di decadimento WW (*) 2l2 Dati Spring07 CMSSW_1_3_x 100 pb -1 (47 pagine)
Dipartimento di Matematica Applicata Università di Firenze Multiband transport models for semiconductor devices Giornata di lavoro sulle Nanoscienze Firenze.
Raffaele Cirullo Head of New Media Seconda Giornata italiana della statistica Aziende e bigdata.
Remote Sensing Laboratory ISTITUTO NAZIONALE DI GEOFISICA E VULCANOLOGIA Valerio Lombardo GNV 2007 Progetto Etna.
CarboItaly : attività e risultati
1 A neural approach to the analysis of CHIMERA experimental data CHIMERA Collaboration S.Aiello 1, M. Alderighi 2,3, A.Anzalone 4, M.Bartolucci 5, G.Cardella.
Giorgio Corani, Giorgio Guariso Dipartimento di Elettronica ed Informazione Politecnico di Milano Fuzzy modelling of basin saturation.
C Consiglio Nazionale delle Ricerche - Pisa Iit Istituto per lInformatica e la Telematica Reasoning about Secure Interoperation using Soft Constraints.
Biometry to enhance smart card security (MOC using TOC protocol)
Quale dei seguenti composti può comportarsi da acido di Broensted ? Quale è la relativa reazione con una base? Cl -, HSO 4 -, NH 4 +, NH 3, H 2 S, OH -
TIPOLOGIA DELLE VARIABILI SPERIMENTALI: Variabili nominali Variabili quantali Variabili semi-quantitative Variabili quantitative.
Directive 96/62/EC - Ambient Air Quality List of air pollutants in the context of air quality assessment and management.
2000 Prentice Hall, Inc. All rights reserved. 1 Capitolo 3 - Functions Outline 3.1Introduction 3.2Program Components in C++ 3.3Math Library Functions 3.4Functions.
Magnetochimica AA Marco Ruzzi Marina Brustolon
Workshop 1: Lanziano Moderatori: E. Sagnelli, F. Suter Discussant: F.v. Schloesser Recupero immunologico e progressione clinica G. Liuzzi.
Introduzione Grid1 Introduzione ai Sistemi Grid. Introduzione Grid2 Generalità Un sistema Grid permette allutente di richiedere lesecuzione di un servizio.
Chistmas is the most loved holiday of the years. Adults and children look forward to Chistmas and its magical atmosphere. It is traditional to decorate.
WP 10 – Applicazioni Astrofisica – stato Leopoldo Benacchio INAF Osservatorio Astronomico di Padova Pisa maggio 03.
National Project – on going results Potenza 7/10 November 06 IT-G2-SIC-066 – Social Enterprise and Local Development.
Compito desame del Svolgimento della Sezione 5: CONTROLLORI Esempio preparato da Michele MICCIO.
LHCf Status Report Measurement of Photons and Neutral Pions in the Very Forward Region of LHC Oscar Adriani INFN Sezione di Firenze - Dipartimento di Fisica.
SOURCE TERM ON NPP SAFETY ANALYSES Marino Mazzini Professore Ordinario nel s.s.d. Impianti Nucleari Università di Pisa Facoltà di Ingegneria Dipartimento.
Concord A tool for the analysis and concordances of the terminological constituents P. Plini, N. Mastidoro* * - Èulogos, Rome Institute for Atmospheric.
Scuola di Dottorato della Facoltà di Scienze MM. FF. NN., Università di Milano Bicocca ELEMENTI DI ORGANIZZAZIONE AZIENDALE Funzione finanza e controllo:
Francesca Pizzorni Ferrarese 05/05/2010
PASTIS CNRSM, Brindisi – Italy Area Materiali e Processi per lAgroindustria Università degli Studi di Foggia, Italy Istituto di Produzioni e Preparazioni.
STAGE IN LINGUA INGLESE ISIS GREENWICH SCHOOL OF ENGLISH GREENWICH Data: dal al Studenti delle II-III-IV classi Docenti coordinatori:
Gli ambienti di apprendimento Firenze, 3 marzo 2006.
UNIVERSITÀ DEGLI STUDI DI PAVIA FACOLTÀ DI ECONOMIA, GIURISPRUDENZA, INGEGNERIA, LETTERE E FILOSOFIA, SCIENZE POLITICHE. Corso di Laurea Interfacoltà in.
Motor Sizing.
Richard Horton , Lancet 2005.
embryo GPS dish (Rieger et al., 2007) Avvicinamento degli embrioni rispetto a micro gocce tradizionali e minore superficie.
BACKGROUND. Double-blinded, randomized, 6-days, crossover study Patients were admitted to the Department of Pediatric Federico II University, Naples.
UG40 Energy Saving & Twin Cool units Functioning and Adjustment
EMPOWERMENT OF VULNERABLE PEOPLE An integrated project.
COSMO-LEPS verification SON 2004 precipitation new suite Chiara Marsigli ARPA-SIM – WG4.
UITA Genève ottobre Comitè du Groupe Professionnel UITA Genève octobre 2003 Trade Union and Tour.
A PEACEFUL BRIDGE BETWEEN THE CULTURES TROUGH OLYMPICS OLYMPIC CREED: the most significant thing in the olympic games is not to win but to take part OLYMPIC.
Moles and Formula Mass.
Guida alla compilazione del Piano di Studi Curricula Sistemi per l’Automazione Automation Engineering.
Lezione n°27 Università degli Studi Roma Tre – Dipartimento di Ingegneria Corso di Teoria e Progetto di Ponti – A/A Dott. Ing. Fabrizio Paolacci.
Quality Assurance in Career Guidance Services IAEVG 2009 Conference Jyväskylä, FI Leonardo Evangelista
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8 Analisi Fattoriale: Scelta del numero di fattori e loro interpretazione.
5^BLS Regione Friuli Venezia Giulia Liceo Scientifico “Albert Einstein”
Final Review Meeting Livorno, Italy January 30-31, 2012
SUMMARY Time domain and frequency domain RIEPILOGO Dominio del tempo e della frequenza RIEPILOGO Dominio del tempo e della frequenza.
Do You Want To Pass Actual Exam in 1 st Attempt?.
The Behavioral Insight Team
The effects of leverage in financial markets Zhu Chenge, An Kenan, Yang Guang, Huang Jiping. Department of Physics, Fudan University, Shanghai, ,
Transcript della presentazione:

Reti Neurali nella previsione di variabili ambientali

Organizzazione dell’esposizione Il problema previsionale Soluzione lineare (ARX) Intelligenza artificiale e idrologia: approccio con reti neurali Pruning Risultati (Olona, Tagliamento) Previsione del PM10 a Milano

Requisiti di un sistema previsionale accuratezza previsionale .. anche nel caso in cui non siano disponibili i dati rilevati da tutte le stazioni (robustezza) velocità computazionale minimo orizzonte temporale utile

Problematiche Idrologiche Variabilità spaziale: piogge/ permeabilità Non linearità: imbibimento del terreno. ingressi pluviometrici concentrati / distribuiti modelli lineari/ non lineari Pioggia cumulata 5gg Rainfall/Runoff

Schema di previsione y(t) y(t-1) y(t-m) ... u2(t-) u2(t-  -1) u2(t-  -m) u1(t-) u1(t-  -1) u1(t-  -m) PREVISORE y(t+1) y(t, t-1,..): termini autoregressivi (portate) u1,u2(t-,t --1,..): termini esogeni (piogge) : tempo di corrivazione piogge portate (ritardo)

Previsione ricorsiva a K passi yt u1t- yt-1 u1t- -1 …. yt-L+1 … PREVISORE u1t-+1 yt u1t- …. yt-L … La del passo precedente diventa il primo termine autoregressivo nella nuova previsione PREVISORE K max = min(1, 2.. M)+1

Approccio black-box lineare (ARX) pioggia media: un unico ingresso X (perdita di informazione) n ingressi esogeni : pluviometri disponibili (es: 2) stima parametrica MQ linearità ordini delle parti = ???

Misure in tempo reale 1 AR X1 X2 X3 Xn 2 X1 3 X2 Se Xi non è disponibile si ha il blocco del predittore. Soluzione: previsori d’emergenza 2 X1 3 X2

In corrispondenza delle soglie si ha un brutale cambio di modello ARX con soglie Un diverso modello ARX per ogni classe idrologica dominio di portata (mc/sec) Soglia S1 S1=???? Soglia S2 S2=???? Predittore 1 Predittore 2 Predittore 3 In corrispondenza delle soglie si ha un brutale cambio di modello

Dagli ARX alle ANN Richiesta di modellizzazione non lineare ARX vs reti neurali Quale complessità per il predittore neurale? Ottimalità parametri Ottimalità ingressi (robustezza) pruning

Reti Neurali Artificiali (ANN) x0 x1 x2 y xr ...  f w1,1 wn,r input strato nascosto (n neuroni) output neurone d’uscita

Modelli di neuroni artificiali somma pesata degli ingressi (cfr. dendriti) xt xt-1 xt-2 ...  w1,1 w1,r b 1 input neurone = f(Wx+b) xt- xt --1 funzione logistica (cfr. assone)

Reti Neurali Artificiali (ANN) x0 x1 x2 y xr ... w1,1 wn,r  strato nascosto (n neuroni) neurone d’uscita output input

Apprendimento Il numero di parametri può arrivare a diverse centinaia Algoritmi di ottimizzazione non lineare per la stima dei parametri,ad es minimizzando overfitting

Diversi training di una medesima struttura neurale Ann: problematiche Minimi locali Diversi training di una medesima struttura neurale Pruning: rimozione di parametri da una rete di partenza completamente connessa ottimale ed automatica selezione della struttura, non completamente connessa “Early stopping” Regolarizzazione Sovrataratura Architettura ottimale Tentativi ed errori

Analisi di Salienza Sj è misura dell’incertezza di stima la rimozione del peso con minima Sj genera il minimo incremento di Etrain

E test E train L’idea del pruning Calibrazione = training + testing Training (LM) della rete iniziale sovraparametrizzata Valutazione errore di test Stima salienza dei pesi Eliminazione peso a minore salienza Retrain della nuova rete E test Test error Training error Num parametri E train

Caso Di Studio: Previsione in Tempo Reale Delle Portate Del Fiume Olona

Inquadramento Idrologico Area bacino (Castellanza): 190 kmq Portata media: 2.5 mc/sec Portata attesa per T=10 anni: 108 mc/sec Minimo orizzonte previsionale utile: 3ore basse correlazioni piogge/portate Stazioni di misura: un idrometro, tre pluviometri 15 eventi considerati (circa 1100 passi orari)

Struttura dei previsori ARX: ordini 2,111 5 par. ANN1: 19 par. (6 neur, 3 pluv) ANN2: 5 pars. (2 neur, 2 pluv)

Risultati Taratura Validazione RMSE Varianza non spiegata Corr V/P ARX .016 ANN1 .011 ANN2 .014 .017 .013 Varianza non spiegata .377 .313 .345 .452 .327 .350 Corr V/P .926 .951 .940 .892 .949 .937 3 h avanti ANN vs ARX: miglioramento del 10% in training miglioramento del 20% in validazione utilizzando una stazione pluviometrica in meno!!

Caso di studio: Tagliamento Area bacino: 2480 kmq Q media: 90 mc/sec Picco piena (1966) : 4000 mc/sec 5 stazioni pluviometriche 2000 dati di piena a passo orario

Letteratura Campolo et. Al. Water Resources Research, 1999 Rete neurale completamente connessa (5 pluviometri) Efficienza 5h avanti: 85%

Risultati di pruning Rete non completamente connessa Utilizzo di 3 soli pluviometri Efficienza 5h avanti: 84,5 %

Conclusioni (1) ANN permettono migliore qualità previsione rispetto ai lineari ARX (efficienza) pruning trova in modo analitico una struttura ottimale riduzione degli ingressi pluviometrici senza penalizzazione delle prestazioni previsionali

Basin saturation issues The catchment response to rainfall impulses depends strongly on the saturation state of the basin An indirect measure at time (t) may be obtained by using the information R(,t), i.e. cumulated rainfall on the time window [t-,t] The proxy can be noisy (spatial interpolation from local rain measures, differences between saturation and precipitation) The basin state at time (t) is classified in a fuzzy way. For instance: 1(t) : membership related to saturation class 1 (“dry” class) 2(t) : membership related to class 2 (“wet” class) 1(t) + 2(t) =1 (constraint)

Fuzzyfication of cumulated rainfall R(,t) Suitable values of  are found via hydrological analyses A set of centroids is identified on R(,t) (C-means fuzzy clustering algorithm) We fuzzify the basin state at each time step of the dataset

Coupling fuzzy logic and neural networks The rationale: each saturation class results in a different non-linear rainfall-runoff relationship The idea: to train a different, specialized neural network on each saturation class to issue the forecast by linearly combining the prediction of the different models the higher the membership related to a given saturation class, the higher the weight of the corresponding predictor on the forecast

Specialized predictors training We implemented a weighted least squares variant of the LM training algorithm: To prevent overfitting, we jointly use regularization and early stopping during the training The optimal architectures are selected via trial and error (20 estimates of each model) The model showing the lowest wls on the validation set is finally chosen

Issuing the forecast As in Takagi Sugeno systems, we linearly combine the output of the specialized models: is the prediction of the j-th specialized model Switching between models is smooth and ruled by the state of the basin at time (t)

Olona: 3-hours ahead prediction performances (testing set) Model Efficiency (R2) Correlation  RMSE High flows error FFNN .85 .93 .30 .294 Fuzzy (=2 days) .86 .94 .29 .319 (=5 days) .88 .95 .27 .284 The fuzzy framework with =5 days appears the most effective forecasting approach

Simulation sample

CASO DI STUDIO: Tagliamento Suddivisione dati: Set di addestramento 1273 istanti Set di prova 483 istanti Set di validazione 599 istanti

SOFTWARE: nnsyssid20 Calcolo centroidi e membership: Funzione C-Means Clustering Addestramento delle reti: Funzione wls_trial Stima dell’altezza idrometrica: Funzione fuzzy_report

RISULTATI 1/2 Errore quadratico medio: Indice di correlazione: Valutazione statistica Errore quadratico medio: Indice di correlazione: Fo varianza dati reali F errore quadratico medio Efficienza modello:

RISULTATI 2/2 Previsione con Pcum 5gg (t+5) Confronto tra le altezze idrometriche previste e quelle registrate sull’intero set di validazione per i dati orari tra il 1978 e il 1996.

CONFRONTO CON LETTERATURA Previsione con passo di 5h Corani e Guariso rmse — ρ 0,9480 eff 0,8790 Campolo et al. rmse — ρ eff 0,8500 eff 90,5 %

Conclusions (2) The proposed approach uses specialized models and couples their output via fuzzy logic, in order to account for the basin saturation state The framework outperforms the classical FFNN rainfall-runoff approach The framework complexity does not involve significant computational overload nor additional measurement costs to issue the prediction

Un’altra applicazione: reti neurali per la previsione del PM10 a Milano

Milan case study Significant reduction of the yearly average of pollutants such as SO2, NOx, CO, TSP (-90%, -50%, -65%, -60% in the period 1989-2001). A major concern is constituted by PM10. Its yearly average is stable (about 45mg/m3) since the beginning of the monitoring (1998). The limit value on the daily average (50mg/m3) is exceeded about 100 days every year. The application: prediction at 9 a.m. of the PM10 daily average concentration of the current (and the following) day.

Air pollutants trends on Milan SO2, NOx and CO: decreasing trends (catalytic converters, improved heating oils) PM10 and O3: increasing from the early 90’s

Prediction methodology: FFNN The input set contains both pollutants (PM10, NOx, SO2) and meteorological data (pressure, temperature, etc). The input hourly time series are grouped to daily ones as averages over of given hourly time windows (chosen by means of cross-correlation analysis). The architecture is selected via trial and error and trained using the LM algorithm and early stopping. PM10 expected concentration Hidden layer: logistic  Input set X1 X2 X3 Xn

PM10 time series analysis Available dataset: 1999-2002 Winter concentrations are about twice as summer ones, both because of unfavorable dispersion conditions and higher emissions On average, concentrations are about 25% lower on Sundays than in other days

Deseasonalization approach Yearly and weekly PM10 periodicities are clearly detected also in the frequency domain The same periodicities are detected also on NOx and SO2 On each pollutant, we fit a periodic regressor R(,t) before training the predictors. PM10pred (t)= R(,t) + y(t) [y(t) is the actual output of the ANN] R(,t)= =c+f(1,t)+ f(2,t) where: f(,t)=k [aksin(k t)+bkcos(k t)] k=1,2 1 =2/365 day-1; 2 =2/7 day-1 Meteorological data are standardized as usual.

Prediction at 9 a.m. for the current day t Deseasonalized Normalized average behavior  0.94 0.91 MAE 7.70 (17% m) 8.71 (19% m) 50 mg/m3 threshold detection CPO 0.81 0.87 CPP 0.83 FA 0.09 0.17 CPO: CPP: FA: Satisfactory performances. Deseasonalization allows to increase the average goodness of fit indicators As a term of comparison, a linear ARX predictor results in  = 0.89 and MAE=11mg/m3

Prediction for the following day (t+1) To meet such an ambitious target, we added further meteorological improper (i.e., unknown at 9 a.m. of day t) input variables, such as rainfall, temperature, pressure etc. measured over both day t and t+1 The performances obtained in this way can be considered as an upper bound of what can be achieved by inserting actual meteorological forecasts in the predictor Pollutant time series have been again deseasonalized via periodic regressor We tried - besides trial and error - also a different identification approach for neural networks, namely pruning

OBS pruning algorithm training of the initial fully connected architecture; ranking of parameters on the base of their relevance (saliency); elimination of the parameter with the lowest saliency; generation of a new architecture (one parameter less); re-training of the obtained network; evaluation of the mean square error over the validation set; back to step 2, until there are parameters left

Pruned ANNs The network showing the lowest validation error is finally chosen as optimal Pruned ANNs are parsimonious: they contain one order of magnitude less parameters than fully-connected ones Selection  X1 X2 X3 Xn Pruned network sample

50 mg/m3 threshold detection Results Connected NN Pruned NN average behavior  0.76 MAE 13.08 (29% ) 12.89 50 mg/m3 threshold detection CPO 0.73 0.72 CPP 0.75 FA 0.25 0.24 Performances of the two models are very close to each other, decreasing strongly with respect to the 1-day case As a term of comparison, the network trained without improper meteorological information looses just a few percent over the different indicators, showing an almost irrelevant gap

Conclusions (3) Performances on the 1-day prediction appears to be satisfactory: in this case, the system can be really operated as a support to daily decisions (traffic blocks, alarm diffusion,…). Deseasonalization of data before training the predictors seems to be helpful in improving the performances. 2-days forecast are disappointing, even if improper meteo data are introduced. Performance differences between pruned and fully connected neural networks are neglegible. More comprehensive meteorological data (vertical profiles, mixing layer) may be more substantial than training methods in improving the quality of longer term forecasts.

Altre architetture di reti RETI RICORRENTI: alcune uscite ritornano in ingresso all’iterazione successiva. Utilizzate in diversi campi (http://www.idsia.ch/~juergen/rnn.html). PROBLEMA: come effettuare l’addestramento? Possibile soluzione: prevedere un numero massimo di cicli

servono per estrarre caratteristiche (come Componenti Principali) RETI AUTOASSOCIATIVE: addestrate a riprodurre gli ingressi, passando per uno strato con pochi neuroni: servono per estrarre caratteristiche (come Componenti Principali) utili per scoprire i legami (non lineari) tra gli ingressi Utili, ad esempio, per la diagnostica di reti di sensori (un sensore guasto dà risultati diversi da quelli in uscita dalla rete).