5 Marzo 2007 13-14 December Luxembourg Uso statistico delle fonti amministrative: la valutazione della qualità degli archivi e le basi integrate di microdati.

Slides:



Advertisements
Presentazioni simili
Monitoraggio e valutazione dei servizi formativi
Advertisements

Il conto delle Amministrazioni pubbliche e la realizzazione del SIOPE - la problematica dell’identificazione delle unità - Giuseppe Garofalo ISTAT – Direzione.
IL COORDINAMENTO DELLA MODULISTICA E DEGLI ARCHIVI AMMINISTRATIVI Parte lattività: metodi, procedure e strumenti a supporto Giovanna DAngiolini, Edoardo.
Metodologie e strumenti per lanalisi delle qualità dei dati Roma, 12 marzo 2001 Obiettivi del progetto RAE e qualità dei dati negli archivi amministrativi.
Il patrimonio informativo, le condizioni di utilizzo e accesso ai microdati dell’Istat Luisa Franconi Istat - Direzione centrale per lo sviluppo dei sistemi.
Marco Marini Intervento su La revisione delle serie in volume dei conti nazionali: innovazioni metodologiche e nuovi indici dei valori medi unitari. Coautori:
Innovazione nelle indagini statistiche sui trasporti
Verso un conto del capitale umano Cos’è il capitale umano
L’informazione statistica ufficiale per l’analisi economica
L’informazione statistica ufficiale per l’analisi economica
Enrica Morganti Intervento su Concetti, definizioni e progettazione di registri statistici a supporto delle statistiche sull'internazionalizzazione. Il.
LE RILEVAZIONI NEL SETTORE AGRICOLO (Loretta Lolli)
Area: la gestione dei progetti complessi
Convegno Sistemi Informativi per il governo delle politiche sociali
LA PRESENZA DEGLI UFFICI DI STATISTICA PROVINCIALE NEI CIRCOLI DI QUALITA LA PRESENZA DEGLI UFFICI DI STATISTICA PROVINCIALE NEI CIRCOLI DI QUALITA Prima.
Direzione Centrale per il Coordinamento e lo sviluppo del Sistan e della rete territoriale Lapplicazione del Codice italiano delle Statistiche Ufficiali.
USCI – Comune di Brescia UNA CITTÀ PER CONTARE Convegno nazionale In direzione ostinata e complessa: verso un archivio dinamico per l'analisi demografica.
Confronti tra fonti Corso in Fonti, metodi e strumenti per lanalisi dei flussi turistici A.A Prof.ssa Barbara Baldazzi Corso di Laurea PROGEST.
Gli enti ed uffici del Sistema statistico nazionale uniformano la propria attività ai seguenti principi.
azienda speciale della Camera di Commercio di Milano
1 Dai principi all'effettiva misurazione e valutazione dei risultati Giornata della trasparenza – CCIAA Prato 19 luglio 2012.
Progettazione di una base di dati
Comitato metodologie 9 luglio 2010 Costituzione di una rete per linnovazione metodologica nella produzione statistica.
Valutazione della ricerca: le opportunità offerte dallOpen Access Alberto Silvani Torino 18 ottobre 2010 Questo/a opera è pubblicato sotto una Licenza.
I beni relazionali: misurabilità dal lato delle unità economiche
Fondazione per la Diffusione della Responsabilità Sociale delle Imprese (I-CSR) 1 Progetto IntendeRSI La Responsabilità Sociale delle Agenzie per il Lavoro.
2011: XV Censimento della popolazione e delle abitazioni
Fasi di progetto di SI Impostazione strategica e di disegno concettuale Implementazione Utilizzo e monitoraggio.
Corso di Laurea in Ingegneria per l’Ambiente e il Territorio Informatica per l’Ambiente e il Territorio Docente: Giandomenico Spezzano Tutor: Alfredo Cuzzocrea.
Variabili temporali Analisi statistica
Dipartimento Mercato del Lavoro e Politiche Sociali Struttura Inclusione Sociale Roma, Corso Italia 33 Roma, 18 marzo 2015 “Strumenti informativi per il.
La pianificazione della produzione dei dati. Costituzione del gruppo di progettazione L’elevato grado di complessità e la multidisciplinarietà richiesta.
L'analisi dei testi per la realizzazione del Web Semantico: quali gli strumenti e le applicazioni Paolo Poto Expert System Spa.
Marina Signore Dirigente il Servizio “Qualità statistica, coordinamento progetti europei di ricerca e sviluppo e Cooperazione internazionale” La qualità.
Progettazione di una base di dati Ciclo di vita di un sistema informativo Studio di fattibilità definisce le varie alternative possibili, i relativi costi.
Rossella Salvi – Responsabile Ufficio Statistica / PROVINCIA DI RIMINI - 1 Seminario RECORD LINKAGE E SISTEMA DEGLI OSSERVATORI DELLA PROVINCIA DI RIMINI.
Sistemi di Gestione dei Dati e dei Processi Aziendali Computer-Assisted Audit Technique (CAAT)
Workshop Istat Micro dati per l’analisi della performance delle imprese: fonti, metodologie, fruibilità, evidenze internazionali L’uso di microdati nei.
Genova 22/24 settembre BASE DATI TERRITORIALI E GEOCODIFICA NUMERI CIVICI Fabio Crescenzi, Istat Verso un nuovo uso di indagini e dati di fonte.
Presentazione del Secondo Rapporto sulle condizioni abitative degli anziani in Italia che vivono in case di proprietà Roma 6 novembre 2015 Centro.
Le basi di dati.
Orientamento per il successo scolastico e formativo PIANO REGIONALE ORIENTAMENTO USR Lombardia 1° incontro – Introduzione.
5 Marzo December Luxembourg Uso statistico delle fonti amministrative: la valutazione della qualità degli archivi e le basi integrate di microdati.
Lo sviluppo della statistica comunale tra censimento ed integrazione delle fonti amministrative La statistica comunale fra passato, presente e futuro Milvia.
Integrazione delle fonti e utilizzo statistico degli archivi amministrativi nei comuni per la conoscenza del territorio e il supporto alle decisioni pubbliche:
Box-plot del reddito dei genitori degli studenti per tipo di gestione delle scuole.
Servizio Controllo Strategico e Statistica Giornata seminariale L’IMMIGRAZIONE NELLA PROVINCIA DI MODENA mercoledì 27 febbraio 2008 Fonti e Archivi per.
Uso statistico delle fonti amministrative: l’Istat per il coordinamento della modulistica e la documentazione degli archivi amministrativi Giovanna D’Angiolini.
I DONEITÀ DI C ONOSCENZE E C OMPETENZE I NFORMATICHE ( A – D ) Un database è un insieme di record (registrazioni) e di file (archivi) organizzati per uno.
Milano 19/11/04 Innovazione e qualità nella casa: Homevolution – una visione comune alla filiera per la crescita del mercato 1 Da Domotica ad Homevolution:
"La presenza straniera in Italia: l'accertamento e l'analisi" L’integrazione straniera nel tessuto economico: fonti attuali e prospettive Manlio Calzaroni.
Roma, 6 dicembre Valeria Stancati “L’indagine sul Trasporto marittimo - Caratteristiche dell’indagine e innovazioni in corso” Innovazione nelle indagini.
Napoli, 28 ottobre Le fonti amministrative dei e per i Comuni e le nuove opportunità derivanti dal Progetto ARCHIMEDE: potenzialità e criticità.
1 1 Il primo giro d’Italia delle donne che fanno impresa Enzo Santurro Retecamere 14 Gennaio 2013 Seminario formativo V ALORIZZARE LE COMPETENZE PER L.
ROMA 22 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Nuove prospettive per il censimento della popolazione INNOVAZIONI E SPERIMENTAZIONI.
ROMA 24 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE Raffaella Cagliano NUOVE FONTI E DOMANDE ISTAT - Rilevazione Multiscopo sulle attività complesse.
ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE Big Data e archivi dell’Amministrazione finanziaria: metodologie innovative di analisi e integrazione,
ROMA 24 GIUGNO 2016 SPAZIO CONFRONTI Titolo presentazione SPAZIO CONFRONTI Il nuovo sistema informativo regionale emiliano-romagnolo per la gestione delle.
ROMA 23 GIUGNO 2016 SPAZIO CONFRONTI Primo Rapporto statistico sull’area metropolitana romana – Anno 2016 SPAZIO CONFRONTI La statistica utile Programmazione.
ROMA 24 GIUGNO 2016 SPAZIO CONFRONTI Il sistema DARCAP a supporto della rilevazione SIS PRO SPAZIO CONFRONTI Il sistema DARCAP a supporto della rilevazione.
ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione.
ROMA 22 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI - IL PROGRAMMA DI MODERNIZZAZIONE DELL'ISTAT La nuova Raccolta Dati: opportunità.
ROMA 23 GIUGNO 2016 OFFICINA MODERNIZZAZIONE - Gli strumenti del Programma di Modernizzazione dell’Istat Il Sistema dei registri come strumento di integrazione.
ROMA 23 GIUGNO 2016 OFFICINA MODERNIZZAZIONE - Gli strumenti del Programma di Modernizzazione dell’Istat Giulio Barcaroli, Nadia Mignolli - Il modello.
ROMA 22 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI - IL PROGRAMMA DI MODERNIZZAZIONE DELL'ISTAT Piero Demetrio Falorsi - Obiettivi,
ROMA 22 GIUGNO 2016 AREA TEMATICA 3. INNOVAZIONI E SPERIMENTAZIONI Ridisegno delle indagini sociali nell’ottica del censimento permanente INNOVAZIONI E.
ROMA 22 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Una strategia per la qualità nel Sistema Statistico Nazionale PROSPETTIVE DEI SISTEMI.
ROMA 22 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI La qualità della statistica ufficiale: punti di forza e prospettive future PROSPETTIVE.
ROMA 22 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI - IL PROGRAMMA DI MODERNIZZAZIONE DELL'ISTAT Le aspettative sulla rilevanza delle.
Transcript della presentazione:

5 Marzo December Luxembourg Uso statistico delle fonti amministrative: la valutazione della qualità degli archivi e le basi integrate di microdati Manlio Calzaroni – Istat, Direttore centrale delle rilevazioni censuarie e dei registri statistici Seminario URBES, ARCHIMEDE, Censimento permanente I Comuni verso l’uso statistico degli archivi amministrativi e dei sistemi di integrazione delle fonti 28 ottobre 2015, Napoli

Nuove esigenze In tutti i settori della statistica continua ad aumentare la necessità di informazioni. Con l'aumento della complessità e dell'interrelazione dei dati rilevati, crescono anche le esigenze degli utenti di disporre di dati integrati e coerenti. … … su tematiche che riflettono diversi fenomeni di base correlati e interdipendenti. Quindi il modello "stovepipe" in cui le statistiche nei diversi settori vengono prodotte in modo indipendente non è adatto a soddisfare le esigenze politiche di insiemi di dati integrati. Un nuovo modello di produzione delle statistiche Ue

Nuovo modo di produrre … le statistiche per settori specifici non sarebbero più prodotte in modo indipendente; sarebbero invece prodotte come parti integrate in sistemi di produzione completi [impostazione delle statistiche basata sull'idea di un magazzino di dati (data warehouse)] per gruppi di statistiche. Questi sistemi sarebbero basati su una comune infrastruttura (tecnica); applicherebbero nella misura del possibile software standardizzato e utilizzerebbero tutte le fonti di dati disponibili (statistiche e, soprattutto, amministrative). Un nuovo modello di produzione delle statistiche Ue

Nuovo problemi da affrontare A tal fine occorre individuare come le informazioni da fonti diverse possono essere messe insieme e sfruttate per scopi diversi, ad es.: mediante l'eliminazione di differenze metodologiche, uniformando le classificazioni statistiche, ecc. Per ottimizzare l'efficienza gli Stati membri dovrebbero creare una rete di basi dati da cui sia possibile estrarre qualsiasi informazione pertinente. Per ottenere questi risultati: È indispensabile integrare microdati, cioè dati di prevalente origine amministrativa Un nuovo modello di produzione delle statistiche Ue

Prospettive da Eurostat COMUNICAZIONE DELLA COMMISSIONE AL PARLAMENTO EUROPEO E AL CONSIGLIO sul metodo di produzione delle statistiche UE: una visione per il prossimo decennio Bruxelles, COM(2009) 404 definitivo I dati amministrativi nella statistica europea

5 Marzo 2007 Uso dati Amministrativi Ind. Censuarie Ind. Campionarie Multiple integrated data collection Complessità organizzativa Complessità organizzativa Errore campionario Errore non campionario (?!) Errore campionario Errore non campionario (?!) Incoerenza nei concetti Incoerenza nei concetti Integrazione e conciliazione Fisica Logica Informativa Integrazione e conciliazione Fisica Logica Informativa

7 Un bisogno informativo Una indagine Approccio TradizionaleNuovo Approccio Un bisogno informativo Più fonti integrate Riduzione delle risorse finanziarie ed umane Riduzione del “fastidio statistico” Incremento, in quantità e qualità, delle informazioni statistiche richieste dagli utenti (nazionali e internazionali) Incremento della innovazione tecnologica e organizzativa Incremento di informazioni di natura differente (dichiarazioni, tracce digitali) disponibili. Nuove legislazioni, nazionali ed europee, che facilitano l’accesso da parte degli INS a dati non statistici Multiple Integrated Data Collection 1:1 1:n

8 Universo reale Regole amm. Universo Amministrativo Universo Statistico Regole Statistiche determinano applicazione Cosa significa utilizzare fonti amministrative per fini statistici Nuove problematiche per un INS

9 Universo reale Regole amm. Universo Amministrativo Universo Statistico Regole statistiche Traduttore MetaData Traduttore MicroData Cosa significa utilizzare fonti amministrative per fini statistici Nuove problematiche per un INS Qualità dei traduttori determina “Qualità statistica” dei dati amministrativi

Time 10 Statistical Survey Variables Units Multiple Integrated Collection Variables Units Multiple Integrated Data Collection

11 MIDCS è un processo complesso caratterizzato dalle eterogeneità e variabilità (anche nel tempo) delle fonti utilizzate per la produzione di informazioni statistiche. L’uso dell’MIDC modifica l’organizzazione, le tecnologie e le metodologie da adottare Integrazione Verticale: per la stessa unità di analisi, le unità sono raccolte da differenti fonti Integrazione orizzontale: per ciascuna unità le variabili sono raccolte da differenti fonti Multiple Integrated Data Collection

12 Difficoltà nell’integrazione fisica Le diverse fonti possono non essere disponibili in tempi diversi Possono utilizzare concetti/classificazioni non coerenti fra loro Possono utilizzare gli stessi concetti ma con visioni differenti (oggettivo/soggettivo) Contengono differenti tipologie di errori (non campionari/campionari) Possono contenere differenti livelli di qualità intrinseca MIDC: problematiche Processo produttivo complesso : INDUSTRALIZZAZIONE/CENTRALIZZAZIONE Processo produttivo complesso : INDUSTRALIZZAZIONE/CENTRALIZZAZIONE

Def.: Archivio di microdati amministrativi e statistici integrati a supporto dei processi di produzione statistica Obiettivi Comune pretrattamento di Dati Amministrativi (DA) Conformità con le leggi sulla confidenzialità ed il collegamento di dati Uniformità di accesso ai DA per i produttori di statistiche Evitare duplicazioni di lavoro Comune descrizione di metadati e qualità dei DA La risposta Istat Sistema Integrato di Microdati - SIM

Funzioni del SIM L’integrazione alimenta lo sviluppo di Banche dati di l’integrazione di diversi sottosistemi di unità statistiche. Le BD per l’integrazione sono contenitori di microdati utili per consentire una visione uniforme delle unità analizzate mostrando le informazioni disponibili nelle diverse fonti. A. Analisi Formale dei Concetti/ Identificazione delle unità da DAB. Caricamento dei dati su tavoleC. RegistrazioneD. Integrazione E. Diffusione ai produttori di statistiche in ISTAT Processi statistici utilizzando DA Diffusione per gli utenti statistici SIM Integrazione riferita al processo di collegamento tra unità identificate in fonti diverse: individui, unità economiche, luoghi. Ogni unità è identificata con un numero ID unico e stabile(nel tempo). A seconda della variabile (i) di collegamento, è applicata un’adeguata strategia di collegamenti ed una serie di algoritmi.

SIM RELAZIONI TRA INDIVIDUI SIM UNITA’ ECONOMICHE SIM UNITA’ SIM SPAZI SIM RELAZIONI SIM RELAZIONI TRA INDIVIDUI ED UNITA ECONOMICHE INDIVIDUO ID UNITA’ ECONOMICA ID INDIVIDUO ID – FAMIGLIA ID INDIVIDUO ID – FAMIGLIA ID UNITA’ ECONOMICHE ID – UNITA’ LOCALI ID INDIVIDUO ID – UNITA’ ECONOMICA ID INDIVIDUO ID – LUOGHI INDIVIDUALIID INDIVIDUO ID – LUOGHI INDIVIDUALIID UNITA’ ECONOMICA ID – UNITA’ LOCALI ID SIM: I sottosistemi SIM LUOGHI INDIVIDUALI SIM INDIVIDUALI SIM RELAZIONI TRA UNITA’ ECONOMICHE SIM LUOGHI UNITA’ ECONOMICHE

Titolo intervento, nome cognome relatore – Luogo, data Dimensioni della qualità dei dati da indagine e dei DA 1 La misura della qualità dei dati amministrativi considerati come input del processo statistico si differenzia da quella dei dati di indagine output statistico. Le dimensioni della qualità definite in ambito Eurostat per i dati statistici Pertinenza, Accuratezza e attendibilità, Tempestività e puntualità, Coerenza e comparabilità, Accessibilità e chiarezza non sono direttamente caratterizzanti la qualità statistica dei dati amministrativi.

La QRCA è un report condiviso a livello Ue (Blue-ETS) associato ai dati amministrativi Descrive i principali aspetti della qualità dei DA La documentazione della qualità dei dati del SIM avviene facendo riferimento alla QRCA (in corso di implementazione) Titolo intervento, nome cognome relatore – Luogo, data Quindi: Individuare le dimensioni specifiche della qualità a fini statistici di un dato amministrativo La Ue ha sviluppato più studi che sono confluiti in uno schema condiviso - La Quality Report Card for Adm. data 1

Titolo intervento, nome cognome relatore – Luogo, data Qualità dei DA per l’acquisizione di DA 1

Titolo intervento, nome cognome relatore – Luogo, data Dall’analisi concettuale dei dati amministrativi necessaria per il caricamento nelle tabelle Oracle del SIM si generano -Indicatori della Dimensione dei Controlli tecnici (D1) necessari per monitorare in modo tempestivo la fase di acquisizione dei dati (leggibilità dei file, conformità dei dati rispetto alla richiesta, data di acquisizione,..) - Individuazione degli oggetti/entità dell’archivio (M1) su cui calcolare gli indicatori di comparabilità, integrabilità,… Obiettivo -> automatizzare la produzione della QRCA creando inter- operabilità tra le fasi del processo di acquisizione Fase di implementazione [1]

Titolo intervento, nome cognome relatore – Luogo, data Dalla fase di Codifica degli oggetti (impresa, individuo, comune/provincia) si generano - Indicatori di Integrabilità (D2-Dati): C omparabilità degli oggetti Qualità delle variabili di linkage - Indicatori di Accuratezza (D3-Dati) Autenticità degli oggetti Accuratezza delle variabili di classificazione (codici comune e provincia) Indicatori di Completezza (D4-Dati) Copertura Valori mancanti degli identificativi Indicatori della Dimensione temporale (D5-Dati) Dinamicità degli oggetti Fase di implementazione [2]

Titolo intervento, nome cognome relatore – Luogo, data Nella fase di caricamento dei dati dei laureati del Miur si generano 5 oggetti/entità e quindi 5 tabelle : Laureato, Laurea, Corso di studi universitario, Facoltà, Università. Su cui calcolare gli indicatori. Esempio Laureati Miur

Titolo intervento, nome cognome relatore – Luogo, data La fase di Codifica dei laureati/individui consiste nell’assegnazione del codice individuo, unico in tutto il sistema. Tale procedura genera Indicatori di qualità delle variabili di linkage (D2.Integrabilità), indicatori di autenticità degli oggetti (D3.Accuratezza). Nel caso dell’esistenza di registri integrati in SIM, si generano gli Indicatori di copertura (D4.Completezza delle unità). La registrazione della presenza dei codici individuo negli archivi amministrativi nel tempo genera Indicatori della Dinamicità degli oggetti (D5.Dimensione temporale) Esempio Laureati Miur

SIM – Quality Report Card for AD ESS Peer Review 2015 Sottocopertura – Sottocopertura per sottopopolazioni D4. Completezza Unità Confronto con dati ufficiali prodotti dal Miur

Esempio Report di Rilevanza Ente fornitore Archivio Numero richieste Dip.to/ Dir. PSN/ Accordo Regolamenti Europei connessi Inps Archivio E-Mens 8585 Unioncamere- Infocamere Dati dei bilanci delle società di capitali (XBRL) 5552 Agenzia delle Entrate Modelli Unico 8572 Dalla fase di acquisizione dei DA, si può generare in modo automatico un Report di Rilevanza per ciascuna fonte (F2. Rilevanza) che misura l’importanza della fonte, ad es., per la produzione Istat. Si possono analizzare anche informazioni relative al tipo di uso (per frame di campionamento, per e&i, per produzione diretta delle statistiche), alla riduzione del response burden,… …

Titolo intervento, nome cognome relatore – Luogo, data Viste le prospettive che indicano come obiettivo lo sviluppo di sistemi integrati di microdati sostanzialmente amministrativi Gestire la qualità statistica di questi dati significa: 1. Gestione centralizzata e coordinata della acquisizione e archiviazione dei dati – Comitato e SIM Repository unico 2. Definizione di uno schema unico di analisi di qualità statistica - QRCA è un primo approccio disponibile da migliorare e adattare alla realtà nazionale 3. Costruire e sviluppare indicatori specifici per le singole dimensioni individuate - da sviluppare CONCLUSIONI

Unità: integrazione fisica Riconoscimento dello steso oggetto in più fonti e nel tempo Variabili: integrazione logica Riconoscimento dello stesso contenuto semantico in più fonti e nel tempo Variabili: integrazione informativa Riconoscimento della coerenza sintattica fra informazioni desumibili da più fonti L’integrazione

A - Utilizzo di una chiave univoca Codice Fiscale / Record Linkage deterministico B - Utilizzo dei contenuti di caratteri identificati  Persone fisiche - Nome e Cognome da solo o in combinazione con altri caratteri «discriminanti»: data di nascita, nazionalità, indirizzo di residenza, sesso,….  Persone giuridiche – Denominazione da sola o in combinazione con altri caratteri «discriminanti»: attività economica, forma giuridica, dimensione, localizzazione,… Analisi Testuale / Record Linkage probabilistico Integrazione fisica

L’utilizzo del Codice Fiscale  Presente in tutte le fonti amministrative con un alto tasso di copertura  E’ lo «strumento migliore» per identificare uno stesso oggetto (persona fisica/persona giuridica) in più fonti. Problematiche  Non assume la caratteristica di codice identificativo universale  Essendo un codice «parlante» si possono generare duplicazioni di codici (stesso CF per differenti individui), che se pur risolte a livello di Anagrafe Tributaria, possono non essere recepite, o recepite in ritardo da altri Enti.  Gli individui non si referenziano in tutti gli ambiti nella stessa maniera.  Non in tutte le culture è riconosciuta una strutturazione in termini di cognome e nome o c’è un attenzione particolare al momento di nascita (la misurazione del tempo non è universale!)  Vengono fornite differenti strutture identificative ad enti differenti  Date di nascita generiche (si predilige il primo giorno dell’anno)  Duplicazioni nei nomi, particolarmente rilevante per individui nati in alcuni paesi esteri: SING (India), FERDINANDO (Sri Lanka) Integrazione fisica

Soluzione Utilizzo congiunto del Codice Fiscale –con l’analisi testuale dei caratteri identificativi –con tecniche di record linkage probabilistico Ma questo non basta: Un codice fiscale può corrispondere a sogetti diversi, nel tempo le caratteristiche di una unità econmica cambiano ma il CF è lo stesso, Quindi il Codice Identificativo Unico del SIM è il reale codice identificativo di una unità, Migliora la qualità e Supera i problemi di riservatezza. Microintegrazione

–Sistemi di classificazione (localizzazione, professioni, attività economica, tipologia di contratto,….) Differenti tempistiche nell’aggiornamento di uno stesso sistema di classificazione Differenti sistemi di classificazione Privilegiare la descrizione rispetto a strumenti di decodifica Analisi testuale Integrazione logica

–Variabili numeriche Riconoscimento della stessa variabile in due fonti – differente etichettatura con uguale contenuto informativo Differente etichettatura nel tempo per una stessa fonte Processo difficilmente automatizzabile (necessità di analisi puntuale da parte di esperti) Analisi testuale delle etichette Analisi del contenuti informativo (analisi delle distribuzioni/ordini di grandezza dei valori) Integrazione logica

Esempio di base dati integrata Asia occupazione Un archivio LEED – Linked Employer Employee Database Integra 15 fonti Tre punti di vista: –Impresa –Lavoratore –Rapporto di lavoro Integrazione logica

Progetto ARCHIMEDE 33 ASIA- Occupazione E_mens/DMAG/CIGPD Artig./Commerc. ENPALS/INPGI(?) INAIL PARA_INPS CCIAA SOCI/PERSONE Unico quadro RH Altre fonti amministrative Base statistica micro per l’occupazione settore business Previdenziali Auton. Agricoltura Domestici INPDAP NON Previdenziali 770 (CU) Cedolini stipendiali MIUR Lav. Univ. MIUR Lav. Scuola Dichiarazione dei redditi Previdenziali Auton. Agricoltura Domestici INPDAP NON Previdenziali 770 (CU) Cedolini stipendiali MIUR Lav. Univ. MIUR Lav. Scuola Dichiarazione dei redditi Base informativa unica per l’occupazione Integrazione informative: Il sistema Infor. sul mercato del lavoro

Progetto ARCHIMEDE 34 Base informativa unica per l’occupazione Dati Statistici riconciliazione dei disallineamenti delle fonti amministrative nei confronti dei regolamenti statistici Censimento della popolazione SISTEMA INFORMATIVO SUL MERCATO DEL LAVORO Correzione da modello dei dati amministrativi Superamento della tradizionale dicotomia delle analisi economiche e sociali Integrazione informative: Il sistema Infor. sul mercato del lavoro

35 Grazie per l’attenzione