Strumenti e metodologie per la qualità dei dati Luigi Fabbris Università di Padova Comstat.

Slides:



Advertisements
Presentazioni simili
Monitoraggio e valutazione dei servizi formativi
Advertisements

15° Censimento generale della popolazione e delle abitazioni 9 ottobre 2011 Le principali innovazioni.
I giovani anziani in Italia ed Europa: situazione attuale e tendenze di lungo periodo Roberto Leombruni (Labor) Matteo Richiardi (Università Politecnica.
LE PEER REVIEW COME STRUMENTO DI APPRENDIMENTO ORGANIZZATIVO E NUOVE PROSPETTIVE LESPERIENZA DELLE PEER REVIEW PER LUFFICIO DI STATISTICA DEL COMUNE DI.
Paola D'Andrea | Provincia di Pesaro e Urbino
Trasparenza e buona amministrazione: il ruolo della statistica ufficiale nei governi locali Cinzia Viale, Provincia di Rovigo, Coordinamento Uffici di.
Il sistema ad hub per linterconnessione dei nodi Lidea, il contesto e larchitettura del progetto SistanHub Vincenzo Patruno | Istat.
SIGNIFICATO ED USO DEI REPORTS Laurea specialistica in Scienze delle professioni infermieristiche ostetriche pediatriche EMPOLI 2006 Dott.ssa Bernardeschi.
DISEGNO DI UNO STUDIO EPIDEMIOLOGICO
Programmare con il quadro logico
Il patrimonio informativo, le condizioni di utilizzo e accesso ai microdati dell’Istat Luisa Franconi Istat - Direzione centrale per lo sviluppo dei sistemi.
Percorso introduttivo alla statistica ufficiale
1 La qualità dellinformazione statistica nellera digitale Luigi Fabbris Università di Padova Comstat ISTITUTO NAZIONALE DI STATISTICA.
una valutazione dell’esperienza e principali risultati raggiunti
Marco Marini Intervento su La revisione delle serie in volume dei conti nazionali: innovazioni metodologiche e nuovi indici dei valori medi unitari. Coautori:
Innovazione nelle indagini statistiche sui trasporti
Sistema statistico nazionale, modifiche costituzionali ed Europa. Prospettive di adeguamento del d. lgs. 322/89. La proposta di revisione del Gruppo di.
Giovanna Astori Larchivio satellite per lindagine Trasporto merci su strada: obiettivi, fonti e analisi della struttura. Innovazione nelle indagini statistiche.
La piattaforma di BI si basa essenzialmente su un sistema di metadati centralizzato che garantisce la consistenza delle informazioni e consente la navigazione.
L’informazione statistica ufficiale per l’analisi economica
Alfonsina Caricchia I riflessi sulla Contabilità Nazionale della nuova informazione statistica sui processi di internazionalizzazione Linformazione statistica.
L’offerta di microdati da parte dell’Istat
1 5 Marzo 2007 Le liste ausiliarie per laggiornamento delle LAC e per il recupero della sottocopertura anagrafica 15° Censimento generale della popolazione.
LE RILEVAZIONI NEL SETTORE AGRICOLO (Loretta Lolli)
Studio di fattibilità per la costruzione di un gruppo di controllo interno per lanalisi controfattuale Sperimentazione Regione Lazio - Isfol Roma, 27 febbraio.
Progettare una ricerca: approcci e metodologie
PROGETTO PERVINCA Percorsi di Valorizzazione ed Internalizzazione delle Competenze delle Amministrazioni per la gestione del personale - Programma Operativo.
Direttore Nucleo Formazione e Scuola
Convegno Sistemi Informativi per il governo delle politiche sociali
Monitoraggio, analisi e qualità dei dati Lucia Buzzigoli Gianni Marliani Cristina Martelli Dipartimento di Statistica G.Parenti La rilevazione dei prezzi.
Direzione Centrale per il Coordinamento e lo sviluppo del Sistan e della rete territoriale Lapplicazione del Codice italiano delle Statistiche Ufficiali.
Confronti tra fonti Corso in Fonti, metodi e strumenti per lanalisi dei flussi turistici A.A Prof.ssa Barbara Baldazzi Corso di Laurea PROGEST.
Confronti tra fonti Corso in Fonti, metodi e strumenti per lanalisi dei flussi turistici A.A Prof.ssa Barbara Baldazzi Corso di Laurea PROGEST.
Gli enti ed uffici del Sistema statistico nazionale uniformano la propria attività ai seguenti principi.
ISTAT DCRS Novità organizzative e legislative per il PSN (Roma, 24 giugno 2009) Maria Rosaria Simeone (Dirigente Servizio DCRS/IST) Impatto della normativa.
Comitato metodologie 9 luglio 2010 Costituzione di una rete per linnovazione metodologica nella produzione statistica.
Progetto Sede territoriale Istat per la Campania
Progetti di innovazione per la qualità: nuovi avanzamenti Marina Gandolfo | Istat Marina Signore | Istat.
Dott.ssa Tiziana Rossetto, Presidente Federazione Logopedisti Italiani
COORDINAMENTO DELLA FUNZIONE STATISTICA COMUNALE Incontro del 12 dicembre 2013 Gli enti locali di fronte alla riorganizzazione.
Struttura, funzioni e compiti degli operatori della rete censuaria
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Raffaele Malizia Intervento su “Nuovi sviluppi per il sistema statistico nel federalismo municipale ” Convegno nazionale dell’USCI Una città per contare.
- ANNO 2013 Ministero della Giustizia Direzione Generale di Statistica ANALISI DEL LIVELLO DI SERVIZIO RESO A FRONTE DELLE RICHIESTE DATI DA PARTE DELLA.
OCSe-PISA e Veneto. PISA Programme for International Student Assessment ): fu avviato nel 1997 da parte dei paesi aderenti all’OCSE.
FORUM P.A La gestione delle risorse umane nelle pp.aa. tra norme e contratto: efficienza, efficacia ed economicità IL SISTEMA STATISTICO SULLA P.A.
Marina Signore Dirigente il Servizio “Qualità statistica, coordinamento progetti europei di ricerca e sviluppo e Cooperazione internazionale” La qualità.
Enti produttori di statistiche ufficiali Enti istituzionali Enti istituzionali Enti pubblici/titolari di servizio pubblico Enti pubblici/titolari di servizio.
LINEE GUIDA PER LE PROCEDURE OPERATIVE. DA SEGUIRE. NELL’ESPLETAMENTO
Nuovi approcci alle esigenze conoscitive del territorio: verso il censimento permanente Alessandro Valentini Pisa, 23 ottobre 2014.
Workshop Istat Micro dati per l’analisi della performance delle imprese: fonti, metodologie, fruibilità, evidenze internazionali L’uso di microdati nei.
Genova 22/24 settembre BASE DATI TERRITORIALI E GEOCODIFICA NUMERI CIVICI Fabio Crescenzi, Istat Verso un nuovo uso di indagini e dati di fonte.
Presentazione del Secondo Rapporto sulle condizioni abitative degli anziani in Italia che vivono in case di proprietà Roma 6 novembre 2015 Centro.
Il Contesto: Norme, obiettivi e caratteristiche 15° Censimento generale della popolazione e delle abitazioni Formazione UCC Prefettura di Vibo Valentia.
Una lettura del territorio per il territorio Incidentalità stradale in Liguria Anna Militello Ufficio territoriale Istat per la Liguria Genova, 29 ottobre.
L’ATTIVITA’ STATISTICA DELLA BANCA D’ITALIA (modulo a cura BdI)
Statistica sociale Modulo A A.A Prof.ssa Barbara Baldazzi Dottore Mario Mastrangelo Facoltà di Lettere e Filosofia Università di Tor Vergata.
Roma, 6 dicembre Valeria Stancati “L’indagine sul Trasporto marittimo - Caratteristiche dell’indagine e innovazioni in corso” Innovazione nelle indagini.
Carta dei Servizi Servizio Statistica e toponomastica del Comune di Firenze A cura di Elisa Bacci.
ROMA 00 GIUGNO 2016 SPAZIO CONFRONTI Titolo presentazione SPAZIO CONFRONTI Statistiche sull'offerta turistica e territorio: criticità e potenzialità COMPORTAMENTI.
ROMA 23 GIUGNO 2016 SPAZIO CONFRONTI Primo Rapporto statistico sull’area metropolitana romana – Anno 2016 SPAZIO CONFRONTI La statistica utile Programmazione.
ROMA 22 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI - IL PROGRAMMA DI MODERNIZZAZIONE DELL'ISTAT La nuova Raccolta Dati: opportunità.
ROMA 23 GIUGNO 2016 SPAZIO CONFRONTI L’Hub nazionale della statistica pubblica per diffondere dati e metadati armonizzati SPAZIO CONFRONTI L’Hub nazionale.
ROMA 23 GIUGNO 2016 OFFICINA MODERNIZZAZIONE - Gli strumenti del Programma di Modernizzazione dell’Istat Giulio Barcaroli, Nadia Mignolli - Il modello.
ROMA 22 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Ridisegno delle indagini sociali nell’ottica del censimento permanente INNOVAZIONI E.
ROMA 22 GIUGNO 2016 LABORATORIO NUMERACY Competenze tecniche e interpretative acquisite nell'elaborazione dei microdati LABORATORIO NUMERACY «Competenze.
ROMA 22 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Una strategia per la qualità nel Sistema Statistico Nazionale PROSPETTIVE DEI SISTEMI.
ROMA 00 GIUGNO 2016 AREA TEMATICA 2. TEMI EMERGENTI Le statistiche ufficiali sulle richieste di asilo e sui rifugiati TEMI EMERGENTI Le statistiche ufficiali.
ROMA 22 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI La qualità della statistica ufficiale: punti di forza e prospettive future PROSPETTIVE.
ROMA 22 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI - IL PROGRAMMA DI MODERNIZZAZIONE DELL'ISTAT Le aspettative sulla rilevanza delle.
Transcript della presentazione:

Strumenti e metodologie per la qualità dei dati Luigi Fabbris Università di Padova Comstat

2 XI Conferenza nazionale di statistica, 2013 Outline La qualità dei dati I nuovi contesti e le nuove tendenze nella produzione di statistiche ufficiali La qualità dei dati traibili dai sistemi informativi (le nuove anagrafi nazionali) Il ruolo dellIstat – Sistan nel controllo della qualità dei dati Il ruolo degli Uffici di Statistica nel controllo della qualità dei dati di provenienza amministrativa Alcune conclusioni

3 XI Conferenza nazionale di statistica, 2013 La qualità dei dati ufficiali Dimensioni della qualità (Statistics Canada, 2002; National Statistics, 2007; Eurostat, 2009; Kenett & Shmueli, 2013): Pertinenza ( relevance ): grado di concordanza tra il prodotto statistico e il costrutto atteso in termini di copertura e contenuto delle informazioni Accuratezza : prossimità al valore vero Tempestività : pubblicazione entro il tempo pre- determinato Accessibilità fisica e intellettuale (comprensibilità) Comparabilità nel tempo e tra domini di studio Coerenza tra misure del medesimo fenomeno provenienti da diverse fonti e prodotte con metodi diversi Errore di III tipo: prodotto corretto per lobiettivo sbagliato Errore di IV tipo: prodotto corretto, ma troppo in ritardo Errore di I e II tipo

4 XI Conferenza nazionale di statistica, 2013 La qualità statistica dei dati ufficiali Dimensioni della qualità (Statistics Canada, 2002; National Statistics, 2007; Eurostat, 2009): Pertinenza ( relevance ): grado di concordanza tra il prodotto statistico e il costrutto atteso in termini di copertura e contenuto delle informazioni Attendibilità : prossimità al valore vero, funzione di: Precisione campionaria Accuratezza della rilevazione e dellelaborazione dei dati Tempestività : pubblicazione entro il tempo pre- determinato Accessibilità fisica e intellettuale (comprensibilità) Comparabilità nel tempo e tra domini di studio e c oerenza tra misure del medesimo fenomeno provenienti da diverse fonti e prodotte con metodi diversi (armonizzazione)

5 XI Conferenza nazionale di statistica, 2013 Il nuovo contesto La tecnologia sta rendendo scambiabili le basi di dati locali e invita a costruire basi di dati nazionali: Anagrafe nazionale della popolazione (delle famiglie) Anagrafe nazionale delle abitazioni (numeri civici) Anagrafe nazionale delle imprese (ASIA) Pertanto, scompaiono i censimenti tradizionali e sono invece create ed alimentate nel continuo anagrafi nazionali (censimenti continui) per confluenza di quelle locali, scompaiono molte indagini campionarie e cambia il ruolo delle indagini campionarie nel processo di formazione delle statistiche ufficiali Assume un ruolo ancora più importante il controllo della qualità dei dati

La confluenza delle anagrafi This is a bias This is a hot point

7 Che cosa interessa allo statistico ufficiale? La qualità media dellacqua alla foce o lungo la pianura ( la qualità delle statistiche tratte dallanagrafe nazionale )? La qualità dellacqua dei singoli affluenti ( la qualità delle statistiche a livello locale )? Scoprire hot point inquinanti ( le fonti locali i cui errori possono minare lattendibilità delle statistiche nazionali )? La presenza di coccodrilli nellacqua stagnante ( i rischi di distorsione nelle stime traibili dalle anagrafi nazionali, spesso causate da chi organizza le rilevazioni dei dati )? SI Forse SI

Sistema di assicurazione qualità Alla foce (Istat: indagini periodiche per la valutazione della qualità media uscente) Alla sorgente (Sistan: un sistema di chiuse attraverso le quali passa/non passa lacqua) ISTAT (controllo periodico) Revisione metodologica Metadati e buone prassi Interventi sulle fonti locali ? SISTAN (auto-controllo, controllo su richiesta)

9 XI Conferenza nazionale di statistica, 2013 Il controllo continuo della qualità Ente realizzatore: Istat, oppure COGIS, o ente terzo (v. UK) Periodicità: ogni anno, oppure ogni due anni Obiettivi: Valutazione della qualità di statistiche di riferimento in dati domini di studio Controllo, a fini di miglioramento, del sistema di produzione delle statistiche nazionali Campionamento: batch (lotti) di dati prodotti da fonti locali (es: comune, UdS) per stimare anche laccuratezza locale, campionando più intensamente le fonti che, si ipotizza (in base ai dati noti), danno tassi derrore più alti ( hot points )

10 XI Conferenza nazionale di statistica, 2013 Il sistema di controllo locale Gli Uffici di statistica, gangli del SISTAN, per essere funzionali al sistema di controllo, dovrebbero: Essere pochi e di riconosciuta autorità, soprattutto nei confronti del sistema amministrativo di produzione dei dati (es: sistema periferico del Ministero dellInterno, oppure CCIAA) Essere in posizione tale da poter intercettare i flussi di dati locali e poter intervenire in tempi rapidi (es: province, grandi comuni, regioni) Essere formati sul piano statistico e normativo (e relazionale), tanto da essere in grado di elaborare i dati che transitano dallUdS, di comprenderne la qualità e di farla comprendere Sentirsi parte del Sistema statistico nazionale

11 XI Conferenza nazionale di statistica, 2013 I metadati Sono dati di quadro sul metodo e sui tempi di produzione dei dati, compreso il questionario, sui metodi di controllo ed analisi dei dati e sullesito della verifica della qualità dei dati, comprese indicazioni sulla loro utilizzabilità LEurostat (Pellegrino, 2006) ha posto in essere il sistema SDMX standardizzato, a valenza europea, per laccesso a file di metadati generali (es: Transparency of practices, Accessibility, etc.) Un sistema di metadati è il cuore di un sistema nazionale di formazione dei dati; va alimentato con gli esiti del controllo della qualità e con le relative riflessioni in termini di buone pratiche

12 XI Conferenza nazionale di statistica, 2013 La formazione delle fonti dei dati Formazione di carattere metodologico generale sulle rilevazioni statistiche e sul tipo e conseguenza degli errori nei dati Lavoro condiviso sui propri dati: dalla pratica di analisi dei dati e dalla costruzione di indicatori e di report nasce formazione on the job efficace; dalla collaborazione allattività degli amministrativi produttori dei dati si corrobora la consapevolezza della qualità e dei problemi che pone la formazione del dato Review ( self, peer, user ); peer review : forme di valutazione reciproche tra produttori di dati; user review : sistema di raccolta delle osservazioni sui dati da parte degli utenti Applicare il manuale di metadati, le buone pratiche

13 XI Conferenza nazionale di statistica, 2013 La diffusione delle informazioni sulla qualità Interna al sistema: il sistema deve mantenere la sua credibilità complessiva Forma sintetica: Indicatori di qualità, da valutare in serie storica, con interesse preminente per le cause degli errori, per i processi più vulnerabili e per i prodotti più a rischio Gestione dei metadati (v. FBI, us/cjis/ucr/data_quality_guidelines ) finalizzata al raggiungimento di buone pratiche (insieme di coerenze e di ammissibilità, standard metodologici, …) us/cjis/ucr/data_quality_guidelines Periodicità: 3-5 anni

14 XI Conferenza nazionale di statistica, 2013 Problemi del sistema di controllo 1. Lintegrazione tra fonti di origine amministrativa permette di scoprire incoerenze ( inconsistency ) tra dati. Altri errori si scoprono in base alla incoerenza o alla inammissibilità probabilistica tra variabili diverse dello stesso o di altri archivi. Come si utilizzano incoerenze e inammissibilità? Eventualmente a livello locale? 2. Il sistema di controllo ex-post non permette la valutazione della completezza della rilevazione. Lintegrazione tra fonti può, invece, portare alla scoperta di incompletezze. Come si utilizza linformazione sullincompletezza? 3. Che fare dei lotti con tanti errori? 4. La scoperta di errori si può tradurre in metadati ( warning ). Come si può tradurre in suggerimenti per buone pratiche?

15 XI Conferenza nazionale di statistica, 2013 Risorse necessarie Il minor costo del procacciamento dei dati ha liberato risorse. Tuttavia, la qualità costa, va messa a bilancio. Il controllo della qualità richiede indagini interne (svolte dallIstat stesso o da un ente esterno) La verifica interna dei possibili errori nei dati (microdati, batch di dati) richiede tempo e impegno del personale dedicato, anche se diventasse attività di routine degli UdS

16 XI Conferenza nazionale di statistica, 2013 Concludendo…. La qualità dei dati è, e ancor più sarà, uno degli impegni principali dei produttori di dati, come conseguenza del nuovo quadro tecnologico e normativo di produzione di grandi basi di dati statistici a livello nazionale I sistemi di controllo della qualità sviluppati da organismi statistici internazionali e nazionali di vari paesi, anche in ottemperanza a norme ISO 9000 e ISO 20252, mirano a sviluppare, armonizzare e rendere trasparenti i processi, non si interessano ai prodotti Per sviluppare un sistema italiano di controllo della qualità dei dati ufficiali è necessario coinvolgere e attrezzare il Sistan Molte aree rimangono da sviluppare sul piano metodologico se si vuole mettere in piedi un sistema specifico

Ringrazio per lattenzione