ROMA 23 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Gli effetti distorsivi degli errori di localizzazione nella misurazione e nelle analisi.

Slides:



Advertisements
Presentazioni simili
Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Advertisements

Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
STATISTICA DESCRITTIVA
STATISTICA DESCRITTIVA
Intervalli di confidenza
Proprietà degli stimatori
Seminario Una nuova Infrastruttura
ValutaPASSI Gruppo Tecnico PASSI Nazionale Centro Nazionale di Epidemiologia, Sorveglianza e Promozione della Salute (ISS) Incontro Coordinamento Nazionale,
Analisi dei dati per i disegni ad un fattore
Dipartimento di Economia
Progetto Pilota 2 Lettura e interpretazione dei risultati
Localizzazione delle unità in lista precensuaria e ipotesi di geocodifica delle aziende agricole per il 6° Censimento Generale dellAgricoltura La localizzazione.
Innovazione nelle indagini statistiche sui trasporti
L’informazione statistica ufficiale per l’analisi economica
15° Censimento generale della popolazione e delle abitazioni Innovazioni metodologiche: il campionamento Giornate formative per gli UPC Giugno - Luglio.
Inferenza statistica per un singolo campione
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
Dip. Economia Politica e Statistica
CAMPIONAMENTO Estratto dal Cap. 5 di:
LE RILEVAZIONI NEL SETTORE AGRICOLO (Loretta Lolli)
ALBERI DECISIONALI prima parte
Appunti di inferenza per farmacisti
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Metodi di ricerca in Psicologia
Metodi della ricerca in Psicologia
Area: la gestione dei progetti complessi
Proposta di un nuovo indice di distribuzione delle risorse sanitarie Francesco Moscone University of Leicester & University of Cambridge, LSE.
Comitato metodologie 9 luglio 2010 Costituzione di una rete per linnovazione metodologica nella produzione statistica Osservazioni e commenti.
Perfect sampling di processi di coda UNIVERSITÀ DEGLI STUDI DI ROMA TOR VERGATA Corso di laurea in Ingegneria dei Modelli e dei Sistemi Studente: Paolo.
TECNICHE DI CAMPIONAMENTO DI POPOLAZIONI RARE O IN MANCANZA DI LISTE
Corso di POPOLAZIONE TERRITORIO E SOCIETA’ 1 AA
Modelli predittivi delle agenzie di rating internazionali: il modello MEU evoluto (maximum expected utility) Mattia Ciprian*, Daria Marassi°, Valentino.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
LABORATORIO DI ANALISI AVANZATA DEI DATI Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LINEARE MULTIPLA Esempio (d)istruttivo.
accertamento e valutazione degli esiti di apprendimento
Statistica La statistica è
Introduzione al metodo Monte Carlo
Metodi per l’integrazione tra la base dati Health Search e l’indagine Istat sulle condizioni di salute Marco Di Zio Di Consiglio L., Falorsi S., Solari.
Lezione B.10 Regressione e inferenza: il modello lineare
Corso di Analisi Statistica per le Imprese
IL CAMPIONE.
Aspetti Principali: Metodo scientifico
Intervalli di confidenza
Elaborazione statistica di dati
Workshop Istat Micro dati per l’analisi della performance delle imprese: fonti, metodologie, fruibilità, evidenze internazionali L’uso di microdati nei.
Correlazione e regressione lineare
Accademia europea dei pazienti sull'innovazione terapeutica Lo scopo e i fondamenti della statistica negli studi clinici.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Modellizzazione di cabine di trasformazione MT/bt in ambiente esterno Roma - ISPRA 9 Novembre 2011 Corso di formazione ambientale “Introduzione all’utilizzo.
Campionamento procedimento attraverso il quale si estrae, da un insieme di unità (popolazione) costituenti l’oggetto delle studio, un numero ridotto di.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
1 SISTEMI INFORMATIVI TERRITORIALI LABORATORIO APPLICAZIONE di AUTODESK MAP 01 FOGLIO DI LAVORO – VETTORIALIZZAZIONE DI RASTER UNIVERSITA’ DEGLI STUDI.
"La presenza straniera in Italia: l'accertamento e l'analisi" L’integrazione straniera nel tessuto economico: fonti attuali e prospettive Manlio Calzaroni.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Programmazione reticolare Economia e Gestione delle Imprese A. A. 2011/2012.
ROMA 22 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Nuove prospettive per il censimento della popolazione INNOVAZIONI E SPERIMENTAZIONI.
ROMA 22 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Il modello di microsimulazione delle famiglie dell’ISTAT - Discussione INNOVAZIONI E.
ROMA 24 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE Raffaella Cagliano NUOVE FONTI E DOMANDE ISTAT - Rilevazione Multiscopo sulle attività complesse.
ROMA 00 GIUGNO 2016 SPAZIO CONFRONTI Titolo presentazione SPAZIO CONFRONTI Statistiche sull'offerta turistica e territorio: criticità e potenzialità COMPORTAMENTI.
ROMA 24 GIUGNO 2016 SPAZIO CONFRONTI Il sistema DARCAP a supporto della rilevazione SIS PRO SPAZIO CONFRONTI Il sistema DARCAP a supporto della rilevazione.
ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione.
ROMA 22 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI - IL PROGRAMMA DI MODERNIZZAZIONE DELL'ISTAT La nuova Raccolta Dati: opportunità.
ROMA 23 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Il progetto Istat per l’integrazione del dato statistico e del dato geografico INNOVAZIONI.
Il DEFF Il DEFF (Design EFFect) è l’Effetto del Piano di
ROMA 22 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Ridisegno delle indagini sociali nell’ottica del censimento permanente INNOVAZIONI E.
ROMA 22 GIUGNO 2016 OFFICINA MODERNIZZAZIONE - SINERGIE, OPPORTUNITÀ E CRITICITÀ PER LO SVILUPPO DEL PROGRAMMA DI MODERNIZZAZIONE DELL’ISTAT La valorizzazione.
ROMA 22 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI La qualità della statistica ufficiale: punti di forza e prospettive future PROSPETTIVE.
ROMA 22 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI - IL PROGRAMMA DI MODERNIZZAZIONE DELL'ISTAT Le aspettative sulla rilevanza delle.
ROMA 00 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE Titolo presentazione NUOVE FONTI E DOMANDE Profili organizzativi e manageriali del sistema imprese.
Transcript della presentazione:

ROMA 23 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Gli effetti distorsivi degli errori di localizzazione nella misurazione e nelle analisi econometriche di fenomeni spazialmente distribuiti INNOVAZIONI E SPERIMENTAZIONI Gli effetti distorsivi degli errori di localizzazione nella misurazione e nelle analisi econometriche di fenomeni spazialmente distribuiti COMPORTAMENTI INDIVIDUALI E RELAZIONI SOCIALI IN TRASFORMAZIONE UNA SFIDA PER LA STATISTICA UFFICIALE 23 GIUGNO | Simonetta Cozzi, Danila Filipponi | Istat, Roma Giuseppe Arbia | Università Cattolica del Sacro Cuore, Roma Maria Michela Dickson, Giuseppe Espa, Diego Giuliani | Università di Trento

ROMA 23 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Gli effetti distorsivi degli errori di localizzazione nella misurazione e nelle analisi econometriche di fenomeni spazialmente distribuiti 2 In ambito economico, gli errori di localizzazione delle imprese e/o delle unità locali sono indotti da imperfezioni nella fase di cattura del dato mediante tecnologie GPS, in particolare in zone non perfettamente coperte da connessioni satellitari (es., aree isolate o montagnose). In tal caso, quando non è possibile localizzare correttamente sul territorio le unità, queste vengono imputate al centroide della sotto-area che include tali unità (Zimmermann 2008; Jacquez 2012). (unintentional locational error, Arbia et al,2016)). In ambito medico, forestale o sociale, invece, la protezione della privacy delle unità statistiche è un problema centrale, allo scopo di proteggerne le informazioni confidenziali dal cd. disclosure risk (Hunderpool et al. 2010). La riduzione di tale rischio è resa possibile da tecniche di geo-masking, in cui la reale posizione delle unità è dislocata in maniera casual sul territorio interessato (Allshouse et al. 2010) (intentional locational error) Archivi geo-referenziati ed errori di localizzazione L’implementazione e l’utilizzo dei Sistemi Informativi Geografici (GIS) ha assunto nuova rilevanza in molti ambiti di studio e ricerca, grazie al nuovo interesse nei confronti delle analisi territoriali e alla crescente disponibilità di dati geo- referenziati. Dotare le unità statistiche di informazioni circa la loro esatta collocazione geografica sul territorio può essere una procedura che soffre di due ordini di problemi.

ROMA 23 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Gli effetti distorsivi degli errori di localizzazione nella misurazione e nelle analisi econometriche di fenomeni spazialmente distribuiti 3 Archivi di imprese Le procedure di geo-codifica si basano su procedimenti di record linkage, che possono essere di tipo deterministico o probabilitisco. Del primo tipo sono i Geographic Unit Models, in cui una unità consiste di un poligono (o centroide di poligono) che può essere identificato da un codice postale, una regione, una provincia, una circoscrizione, ecc. In tal caso, la posizione dei punti all’interno dell’unità non è specificata. Del secondo tipo sono gli Address Data Models, in cui la procedura di geo-codifica assegna i punti a specifici segmenti di strade (street geo-coding) oppure a codici postali (address points geo-coding), in luogo dei reali indirizzi.

ROMA 23 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Gli effetti distorsivi degli errori di localizzazione nella misurazione e nelle analisi econometriche di fenomeni spazialmente distribuiti 4 Caso 1 Popolazione base Caso 2 Caso 3 Alto Basso A caso

ROMA 23 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Gli effetti distorsivi degli errori di localizzazione nella misurazione e nelle analisi econometriche di fenomeni spazialmente distribuiti 5 Metodi di campionamento spaziale Local Pivotal Methods (LPM1 e LPM2, Grafstro ̈ m et al. 2011) Spatially Correlated Poisson Sampling (SCPS, Grafstro ̈ m 2012) Spatial Balanced Sampling (SBS, Deville e Tillé 2004) Doubly Balanced Spatial Sanpling (DBSS, Grafstro ̈ m e Tillé 2013) Errori di localizzazione e campionamento: effetti in fase di disegno

ROMA 23 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Gli effetti distorsivi degli errori di localizzazione nella misurazione e nelle analisi econometriche di fenomeni spazialmente distribuiti 6 DisegnorRMSEGuadagno % CCS LPM % LPM % SCPS % SBS % DBSS % Dimensione popolazione N=1500 Numerosità campionaria n=150 Simulazioni Monte Carlo nsim=10000 Proporzione di localizzazione imputate 10%, 30%, 50% Target Stima del totale Uno studio di simulazione: alcuni risultati Disegno0,100,300,500,100,300,500,100,300,50 LPM162.13%35.91%31.40%62.13%60.96%52.52%58.38%43.54%21.96% LPM253.00%35.78%29.85%61.95%61.46%52.58%58.96%44.58%21.33% SCPS51.16%35.04%29.56%63.51%61.89%52.20%59.76%44.13%21.32% SBS23.66%23.79%22.40%22.60%24.33%22.87%21.29%18.12%10.95% DBSS62.13%35.34%30.96%60.83%59.91%51.24%58.38%42.58%21.52% Caso 1 Caso 2 Caso 3

ROMA 23 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Gli effetti distorsivi degli errori di localizzazione nella misurazione e nelle analisi econometriche di fenomeni spazialmente distribuiti 7 Errori di localizzazione ed econometria spaziale: gli effetti sulla stima dei parametri L’econometria spaziale è una branca specifica dell’econometria dedicata all’analisi e alla modellizzazione di dati economici caratterizzati dalla presenza di interazione spaziale tra le osservazioni. Una specificazione classica di modello econometrico spaziale è lo Spatial Lag: dove W è una matrice n × n di pesi spaziali e λ il parametro di autoregressione spaziale. La matrice W contiene informazioni sulla relazione spaziale tra tutte le coppie delle n osservazioni. L’elemento w ij di W rappresenta la dipendenza spaziale potenziale tra le osservazioni i-esima e j-esima, dove w ij = 0 per i = j (Arbia, 2014). La presenza di errori di localizzazione porta a un’errata specificazione della vera matrice W, per effetto dell’incertezza sulla misura delle distanze tra le osservazioni dovuta ai fenomeni di imperfetta geocodifica o al geomasking. Diviene perciò rilevante determinare quali sono le conseguenze sulla stima dei parametri β e λ. È qui proposto uno studio di simulazione.

ROMA 23 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Gli effetti distorsivi degli errori di localizzazione nella misurazione e nelle analisi econometriche di fenomeni spazialmente distribuiti 8 Dati spaziali missing Due diversi metodi di generazione dei dati missing. Metodo a) e metodo b)

ROMA 23 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Gli effetti distorsivi degli errori di localizzazione nella misurazione e nelle analisi econometriche di fenomeni spazialmente distribuiti 9 Dati spaziali missing: alcuni risultati per il metodo b) (a) d* = 0.05, (b) d* = 0.15

ROMA 23 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Gli effetti distorsivi degli errori di localizzazione nella misurazione e nelle analisi econometriche di fenomeni spazialmente distribuiti 10 Dati spaziali missing: alcuni risultati per il metodo b) (c) d* = 0.25

ROMA 23 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Gli effetti distorsivi degli errori di localizzazione nella misurazione e nelle analisi econometriche di fenomeni spazialmente distribuiti 11 Geo-masking: alcuni risultati

ROMA 23 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Gli effetti distorsivi degli errori di localizzazione nella misurazione e nelle analisi econometriche di fenomeni spazialmente distribuiti Conclusioni 12  Le metodologie di campionamento spaziale conducono a stime più efficienti del totale anche in presenza di proporzioni considerevoli di unità statistiche attribuite erroneamente al centroide dell’area considerata. L’efficienza si reduce al crescere del numero di unità localizzate in una posizione non veritiera, mantenendo comunque performaces migliori rispetto alle metodologie di campionamento che non considerano lo spazio geografico nella selezione delle unità. Tali risultati sono strettamente legati alla struttura della popolazione considerata, specialmente per quel che riguarda la distribuzione dei valori della variabile oggetto di stima.  La presenza di dati spaziali mancanti riduce la precisione delle stime dei parametri dei modelli di econometria spaziale, e questa riduzione in efficienza è amplificata dalla presenza di elevata correlazione spaziale. Inoltre, gli effetti sono più rilevanti quando i dati spaziali mancanti sono concentrati in porzioni ristrette delle spazio, dove le caratteristiche geografiche, quali gli spillover spaziali, tendono a scomparire. Anche la pratica del geo- masking a protezione della privacy ha un effetto rilevante sulla stima e l’inferenza. Questi effetti dipendono direttamente dall’entità del perturbamento indotto e dal grado di correlazione spaziale nei dati. Come utile indicazione pratica, si osserva la presenza di una forte riduzione dell’efficienza degli stimatori dei parametri dopo una distanza di perturbamento pari al 15% della lunghezza del lato del quadrato rappresentante l’area di studio. Allo stesso modo, se il perturbamento è maggiore di questa distanza, il test di significatività del parametro spaziale diventa altamente inaffidabile.