ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione.

Slides:



Advertisements
Presentazioni simili
Monitoraggio e valutazione dei servizi formativi
Advertisements

LA PROGETTAZIONE DEL MIGLIORAMENTO
L’ANALISI E LA VALUTAZIONE DELL’ IMPATTO
OMEN un anno dopo. Il quadro di riferimento e la Mutual Learning Platform (MLP) Mutual Learning Platform (MLP) : un'iniziativa congiunta di varie DG della.
Benchmarking e valutazione delle politiche dinnovazione Andrea de Panizza Roma 6 luglio a Tavola Rotonda Regionale.
Linguaggi di programmazione
La diffusione dei dati del Censimento della Popolazione Prodotti e servizi di diffusione per i censimenti Mariangela Verrascina -
Verso un Hub per la diffusione delle statistiche pubbliche Esperienze internazionali: il progetto Census Hub Francesco Rizzo | Istat.
VERSO UN CURRICOLO PLURILINGUE, il “P. E. L
4 – Progettazione – Introduzione e Modello E-R
Roma, 12 marzo 2001 Enrica Massella Ducci Teri Sintesi della giornata svolta su "Analisi e verifica della qualità dei dati" del 26 febbraio.
Marco Marini Intervento su La revisione delle serie in volume dei conti nazionali: innovazioni metodologiche e nuovi indici dei valori medi unitari. Coautori:
Innovazione nelle indagini statistiche sui trasporti
Giovanna Astori Larchivio satellite per lindagine Trasporto merci su strada: obiettivi, fonti e analisi della struttura. Innovazione nelle indagini statistiche.
La piattaforma di BI si basa essenzialmente su un sistema di metadati centralizzato che garantisce la consistenza delle informazioni e consente la navigazione.
Presentazione dei lavori per tipologia di base dati e area tematica
L’informazione statistica ufficiale per l’analisi economica
L’informazione statistica ufficiale per l’analisi economica
Alfonsina Caricchia I riflessi sulla Contabilità Nazionale della nuova informazione statistica sui processi di internazionalizzazione Linformazione statistica.
Enrica Morganti Intervento su Concetti, definizioni e progettazione di registri statistici a supporto delle statistiche sull'internazionalizzazione. Il.
Monitoraggio e valutazione dei servizi formativi
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
R. Torlone, A. Calì, G. Lorenzo, G. Solazzo Profilo utente Milano – 17 Novembre 04.
1 Esempi di consistenza sui limiti Non consistente sui limiti, considera Z=2, poi X-3Y=10 Ma il dominio qui sotto e consistente sui limiti: Confrontare.
LE RILEVAZIONI NEL SETTORE AGRICOLO (Loretta Lolli)
Gruppo Nazionale Placement 23 Ottobre 2012
S ILVIO S ALZA - Università di Roma La Sapienza – Aspetti tecnologici della conservazione permanente C ONVEGNO DocArea – Bologna 20 aprile Aspetti.
Incontro di coordinamento Firenze 21 gennaio 2010, 11:00-17:00 Ordine del Giorno Presentazione piano di lavoro eTwinning 2010 Dati registrazioni Proposte.
USCI – Comune di Brescia UNA CITTÀ PER CONTARE Convegno nazionale In direzione ostinata e complessa: verso un archivio dinamico per l'analisi demografica.
Modello E-R Generalizzazioni
Progettazione di una base di dati
Modello E-R Generalizzazioni
Comitato metodologie 9 luglio 2010 Piano di utilizzo delle risorse metodologiche.
Comitato metodologie 9 luglio 2010 Costituzione di una rete per linnovazione metodologica nella produzione statistica.
Elementi di Informatica
La progettazione di un sistema informatico
Progetti di innovazione per la qualità: nuovi avanzamenti Marina Gandolfo | Istat Marina Signore | Istat.
MODELLO LOGICO DEI DATI
Strategia di Lisbona La valutazione degli effetti delle riforme 25 maggio 2007 Lorenzo Codogno Ministero dellEconomia e delle Finanze (MEF) Dipartimento.
Fasi di progetto di SI Impostazione strategica e di disegno concettuale Implementazione Utilizzo e monitoraggio.
Il quadro congiunturale dei trasporti in Italia: movimenti, fatturato e prezzi Trasporto Aereo: indici di valore, indici di prezzo e indici di quantità.
Banca d’Italia, Dipartimento Economia e Statistica
Protocolli clinici: come scriverli
Metodi per l’integrazione tra la base dati Health Search e l’indagine Istat sulle condizioni di salute Marco Di Zio Di Consiglio L., Falorsi S., Solari.
Lo spazio europeo dell’Istruzione Superiore e la prospettiva delle istituzioni AFAM Il contributo delle istituzioni artistiche e musicali europee Alvaro.
La pianificazione della produzione dei dati. Costituzione del gruppo di progettazione L’elevato grado di complessità e la multidisciplinarietà richiesta.
1 Interpretazione astratta: un approccio sistematico all’analisi statica.
Marina Signore Dirigente il Servizio “Qualità statistica, coordinamento progetti europei di ricerca e sviluppo e Cooperazione internazionale” La qualità.
Progettazione di una base di dati Ciclo di vita di un sistema informativo Studio di fattibilità definisce le varie alternative possibili, i relativi costi.
AOT Lab Dipartimento di Ingegneria dell’Informazione Università degli Studi di Parma Intelligenza Artificiale Rappresentazione della Conoscenza e Ragionamento.
Intelligenza Artificiale 1 Gestione della conoscenza lezione 14 Prof. M.T. PAZIENZA a.a
Progettazione di basi di dati: metodologie e modelli
L’assicurazione di qualità nel Quadro del Processo di Bologna Carla Salvaterra Trieste 15 dicembre 2007.
Workshop Istat Micro dati per l’analisi della performance delle imprese: fonti, metodologie, fruibilità, evidenze internazionali L’uso di microdati nei.
La performance delle imprese italiane nel contesto europeo: evidenze dal progetto CompNet Francesca Luchetti Stefania Rossetti Davide Zurlo Workshop Istat.
Presentazione del Secondo Rapporto sulle condizioni abitative degli anziani in Italia che vivono in case di proprietà Roma 6 novembre 2015 Centro.
Standard e strumenti per lo sviluppo del software Marco Carezzano Andrea Andrenacci (ZEROPIU, Business Partner di Telecom Italia) Milano, 2 febbraio 2005.
FORMAZIONE DOCENTI NEO-ASSUNTI Anno Scolastico LABORATORI FORMATIVI INCONTRO CON FORMATORI E TUTOR D’AULA Campobasso 10 Marzo 2016 Giuseppe COLOMBO.
Cos’è la ricerca sociale? La raccolta di informazioni relative ad una realtà, ad un fenomeno sociale secondo obiettivi specifici:
ALGORITMI, LINGUAGGI E PROGRAMMI Facoltà di Lingue e Letterature Straniere Corso di laurea in Relazioni Pubbliche.
Valutazione indipendente del PSR Toscana 2007 – 2013 Le attività di Valutazione Comitato di Sorveglianza Firenze, 28 Ottobre 2011.
ROMA 24 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE Raffaella Cagliano NUOVE FONTI E DOMANDE ISTAT - Rilevazione Multiscopo sulle attività complesse.
ROMA 22 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI - IL PROGRAMMA DI MODERNIZZAZIONE DELL'ISTAT La nuova Raccolta Dati: opportunità.
ROMA 23 GIUGNO 2016 OFFICINA MODERNIZZAZIONE - Gli strumenti del Programma di Modernizzazione dell’Istat Giulio Barcaroli, Nadia Mignolli - Il modello.
ROMA 22 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI - IL PROGRAMMA DI MODERNIZZAZIONE DELL'ISTAT Piero Demetrio Falorsi - Obiettivi,
ROMA 22 GIUGNO 2016 SPAZIO CONFRONTI Integrazione dei dati e valutazione delle policies SPAZIO CONFRONTI Integrazione dei dati e valutazione delle policies.
ROMA 22 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Ridisegno delle indagini sociali nell’ottica del censimento permanente INNOVAZIONI E.
ROMA 22 GIUGNO 2016 OFFICINA MODERNIZZAZIONE - SINERGIE, OPPORTUNITÀ E CRITICITÀ PER LO SVILUPPO DEL PROGRAMMA DI MODERNIZZAZIONE DELL’ISTAT La valorizzazione.
ROMA 00 GIUGNO 2016 AREA TEMATICA 2. TEMI EMERGENTI Le statistiche ufficiali sulle richieste di asilo e sui rifugiati TEMI EMERGENTI Le statistiche ufficiali.
ROMA 22 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI La qualità della statistica ufficiale: punti di forza e prospettive future PROSPETTIVE.
Transcript della presentazione:

ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione 23 GIUGNO | Laura Vignola| Istat

ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione Indice L’ESSNET Validat-Foundation Attività Handbook o Quadro concettuale o Metriche di valutazione Cos’è VTL Valutazione di VTL Conclusioni

ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione Stati membri: Germania, Italia, Lituania, Paesi Bassi Durata: Dicembre Dicembre 2015 Focus : sul processo di validazione e sulla trasmissione dagli stati membri a Eurostat Obiettivo : Definire un linguaggio comune sulla validazione dei dati Sviluppare metriche per la valutazione di procedure di validazione dei dati. Valutare VTL (Validation and Transformation Language). L’ESSNET Validat-Foundation

ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione Indagine per rilevare approcci nell’ESS: => “The survey” Stesura di un documento sulla metodologia (concetti): => “The handbook” Valutazione del linguaggio VTL: => “The PoC” – Proof of concepts => “A Study on VTL” Attività

ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione Quadro concettuale (1/3) “What” “Data Validation is an activity verifying whether or not a combination of values is a member of a set of acceptable combinations.” “Why”: scopo della validazione dei dati e sua relazione con le dimensioni della qualità dei dati (accuratezza, coerenza e comparabilità, chiarezza e tempestività).

ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione Quadro concettuale (2/3) “How” Business perspective Pone l’attenzione sulle differenti attività di validazione (strutturale, all’interno del singolo daset, su più dataset della stessa o di altre fonti, etc..) Approccio formale Pone l’accento sugli elementi che caratterizzano la regola di validazione (L’universo di riferimento, Il tempo, le variabili e l’unità su cui la regola viene applicata)

ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione Quadro concettuale (3/3) Ciclo di vita del processo di validazione Definizione utile per il disegno e la gestione di In piano di validazione, in relazione con le altre fasi del processo di produzione e con altri modelli internazionali di riferimento: GSBPM (Generic Statistical Business Process Model) GSIM (Generic Statistical Information Model)

ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione Metriche Come monitorare la qualità di una procedura di validazione di dati attraverso: le proprietà delle regole di validazione: completezza, ridondanza, fattibilità e complessità; i risultati ottenuti applicando le regole sui dati osservati; i risultati ottenuti applicando le regole sui dati osservati e sui dati di riferimento.

ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione Metriche sulle proprietà delle regole Completezza: il livello con cui il set di regole di validazione copre tutti i controlli necessari per validare un dataset Ridondanza: un sub set di regole, se rimosse non alterano la regione di accettazione del dataset (ex. x>y, y>0, x>0) Fattibilità: se la regione di accettazione non è vuota (ex. x>1, x<0) Complessità: informazioni necessarie per definire una regola, complessità computazionale (tempo di calcolo)

ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione Metriche sui dati osservati Numero di record che falliscono una regola Minimo numero di variabili da cambiare per correggere il record Numero di record che passano gli edit, numero che falliscono per dati mancanti, o per valori errati … Metriche sui dati osservati e sui dati di riferimento Indicatori basati sul confronto Y(dati osservati) e Y* (dati simulati, imputati) Permettono una stima della efficacia del piano di validazione

ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione VTL - Validation and Transformation language linguaggio proposto da EUROSTAT per la definizione di regole di validazione e trasformazione. Principali requisiti del linguaggio: diretto agli statistici e orientato al mondo statistico Il più possibile intuitivo e semplice Indipendente dal dominio statistico, dal tipo di dato (microdato, dato aggregato, registri) dalla fase del processo statistico utilizzabile con standard internazionali(SDMX, DDI, GSIM)

ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione Obiettivo Valutazione di VTL dal punto di vista della completezza, correttezza e usabilità Completezza: ogni regola di validazione può essere espressa usando VTL Correttezza: gli operatori VTL sono consistenti Usabilità: efficienza ed efficacia (raggiungere lo scopo con il minimo sforzo) nell’utilizzo di VTL

ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione Attività Traduzione in VTL, delle seguenti regole di validazione: Sottoinsieme di regole derivanti dall’ESSNET survey ( cleaning/ValidatPoC/tree/master/data)( cleaning/ValidatPoC/tree/master/data) Regole interne Istat: o Inter record o Imputazione deterministica o Calcolo di un indice

ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione Da regole semplici … Il numero di ore lavorate per settimana tra 1 e 80 costi + profitti = fatturato Età del nonno – 28 >= età del nipote ….a regole più complesse Per ogni x: x.età >= 0 AND x.età <= 113 Esiste x: x.id-impresa = 100 AND x.fatturato > Per ogni x: IF x.rel-capofamiglia = 4 THEN esiste y: x.coniuge-id = y.id-persona AND y.rel-capofamiglia = 3

ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione Risultati Completezza: il linguaggio è completo (tutte le regole proposte sono state tradotte in VTL) Correttezza: alcune inconsistenze su alcuni operatori devono essere eliminate (es. operatori union, keep) Usabilità: semplificare alcuni operatori e aggiungerne altri strettamente statistici («try to keep the essence of the validation rule in the translation» )

ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione Conclusioni Handbook: rappresenta un utile supporto alla fase di validazione ne chiarisce concetti fondamentali e fornisce elementi per la valutazione della qualità di un piano di validazione. Valutazione di VTL: impatto immediato all’interno della task force su VTL per la correzione ed il miglioramento del linguaggio. I risultati riportati nel documento «A study on VTL» sono stati di fondamentale importanza per la nuova versione di VTL (1.1).

ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione dei processi di validazione Marco di Zio Giampiero Bianchi Ugo Guarnera Mauro Scanu Laura Vignola Cross Portal EU: