1 Il Progetto Archimede. Le potenzialità per le analisi territoriali Roberta Vivio 23 giugno 2016 XII Conferenza Nazionale di Statistica
2 Che cos’è il progetto Arch.i.m.e.de e quale è la sua attuale collocazione Come ha lavorato Cosa ha prodotto finora La formalizzazione nel PSN La diffusione editoriale L’archiviazione dei microdati in Armida Alcune applicazioni territoriali Il futuro Sommario
5 Marzo 2007 Uso dati Amministrativi 1970/ Ind. Censuarie Ind. Campionarie Integrazione di più fonti Complessità organizzativa Complessità organizzativa Errore campionario Errore non campionario (?!) Errore campionario Errore non campionario (?!) Incoerenza nei concetti Incoerenza nei concetti Integrazione e conciliazione Fisica Logica Statistica Integrazione e conciliazione Fisica Logica Statistica Tipi di raccolta dati e criticità
4 Riduzione delle risorse finanziarie ed umane Necessità di riduzione del “fastidio statistico” Incremento, in quantità e qualità, delle informazioni statistiche richieste dagli utenti (nazionali e internazionali) Incremento della innovazione tecnologica e organizzativa Incremento di informazioni di natura differente (dichiarazioni, tracce digitali) disponibili. Nuove legislazioni, nazionali ed europee, che facilitano l’accesso da parte dei NSAs a dati non statistici Integrazione di più fonti: fattori causali
5 o Le diverse fonti possono non essere disponibili nello stesso momento o Possono utilizzare concetti/classificazioni non coerenti fra loro o Possono utilizzare gli stessi concetti ma con visioni differenti (oggettivo/soggettivo) o Contengono differenti tipologie di errori (non campionari/campionari) o Possono contenere differenti livelli di qualità intrinseca Integrazione di più fonti: criticità
Quali rischi? Progetto ARCHIMEDE Dal punto di vista della conoscenza: Illusione informativa Dal punto di vista statistico: Moltiplicazione dei «rumori» Dal punto di vista della privacy: De-anonimizzazione
7 Integrazione fisica Integrazione concettuale Integrazione statistica Valutazione della qualità Sistema integrato dei microdati Approccio ontologico Sistema dei Registri Valutazione della conciliazione Caposaldi del Processo di integrazione
8 Garanzie: presenza di vincoli esterni ed interni al sistema: Leggi sulla privacy e sul segreto statistico Regole sui limiti alla diffusione di dati elementari (all’interno e all’esterno del SISTAN) Pratiche di sicurezza sui dati chiaramente definite ed applicate in ambito del SISTAN Garanzie: presenza di vincoli esterni ed interni al sistema: Leggi sulla privacy e sul segreto statistico Regole sui limiti alla diffusione di dati elementari (all’interno e all’esterno del SISTAN) Pratiche di sicurezza sui dati chiaramente definite ed applicate in ambito del SISTAN De-anonimizzazione Rischi di violazione della privacy: Disponibilità di informazioni su intere popolazioni le cui unità possono essere caratterizzate da un insieme esteso di variabili Dati per ambiti territoriali molto ristretti Ricostruzione delle storie individuali
ARCHivio Integrato di Microdati Economici e DEmografici C ollezioni di dati elementari funzionali alla ricerca sociale ed economica, alla programmazione territoriale e settoriale, alla valutazione delle alle politiche pubbliche a livello nazionale, regionale e locale. Progetto ARCHIMEDE Progetto ARCHIMEDE – Caratteristiche
Verso l’esterno dell’Istituto: -Diffusione microdati ad un livello di aggregazione territoriale fine -Messa a disposizione di Enti Pubblici di basi di microdati per l’analisi di sottopopolazioni di interesse (schematizzazione delle popolazioni a cui sono rivolti interventi e politiche pubbliche) -Possibilità di identificare strumenti omogenei – indicatori – fra le varie realtà territoriali a supporto alla comparazione territoriale Progetto Archimede – Punti di forza Progetto ARCHIMEDE
11 Verso l’interno dell’Istituto: «laboratorio» -Sperimentazione di nuove metodologie di integrazione e di analisi -Esplorazione/identificazione di segnali delle fonti amministrative utili ai processi statistici. -Ponte fra statistiche sulle imprese e statistiche sugli individui/famiglie -Possibilità di analizzare fenomeni per «popolazioni» diverse Progetto Archimede – Punti di forza
12 Lo stato dell’arte
PSN Popolazioni che usano un territorio e loro mobilità PSN: IST Quantificazione delle popolazioni in ambiti territoriali potenzialmente a rischio PSN: IST Precarietà lavorativa PSN: IST Condizioni socio-economiche delle famiglie PSN: IST Percorsi di istruzione, formazione e inserimento lavorativo PSN: IST
Piano editoriale 2016: Letture statistiche 1.Studenti e scuole dell'istruzione primaria e secondaria in Italia: Differenze strutturali tra scuole statali e paritarie 2.Segmentazione del lavoro autonomo in Italia: Analisi dell'occupazione indipendente attraverso l'uso integrato di fonti amministrative e di indagine 3.Studenti e bacini universitari 14
ARMIDA - ARchivio dei file di MIcroDAti 15 Dati organizzati per indagine: microdati e informazioni documentative tracciato record, variabili e relative classificazioni. 1.Popolazioni che usano un territorio e loro mobilità 2.Precarietà lavorativa 3.Condizioni socio-economiche delle famiglie
16 Alcuni esempi di analisi territoriali
Popolazioni che usano un territorio Individui residenti dinamici in uscita dal comune di residenza, per classe di distanza tra comune di origine e comune di destinazione, e tipologia di attività. ITALIA
Popolazione INSISTENTE su NAPOLI: 1,2 milioni Studenti: Univ.: Occupati: Popolazione con segnali di residenza a NAPOLI: 1 milione) Pop.ne con segnali di residenza in altri Comuni C i (o estero) Dinamica in uscita da NAPOLI Altri (senza Lav. Stu) Studenti: Univ.: Occupati: Napoli - Popolazione insistente e residente Anno 2012 Dinamica in entrata a NAPOLI Dinamica all’interno di NAPOLI Studenti: Univ.: Occupati:
Lavoratori in uscita dal Comune di NAPOLI. Anno 2012 Napoli – Destinazioni degli occupati in uscita
Lavoratori in entrata nel Comune di NAPOLI. Anno 2012 Napoli – Origine degli occupati in entrata
21 UNIVERSITARI per distanza tra Origine e Destinazione (in km), per Ateneo Distanza in km tra Origine e Destinazione 50%
Studenti iscritti per classi di distanza tra residenza e corso 22 Stanziali Pendolari Giornalieri ? Di lungo periodo ?
Popolazioni che usano un territorio Comune di Pisa: Mobilità studenti/lavoratori. Anno 2011 Dinamici all’interno del comune: Dinamici in uscita: Dinamici da altro comune:
24 Età Distribuzione giovani 14/29 anni senza segnali di lavoro/studio nella Regione Lombardia (integrazione di dati Miur/INPS/Fiscali/Anagrafici)
Reddito dei genitori degli studenti per tipo di gestione delle scuole. ITALIA (integrazione di dati fiscali/miur/anagrafici) Condizioni socio-economiche delle famiglie
Percentuale di famiglie monoreddito in cui vive almeno un minore in età prescolare - Anno 2012 Numeratore: numero famiglie monoreddito in cui vive almeno un minore di 6 anni. Denominatore numero famiglie monoreddito. Livello regionale 26 Condizioni socio-economiche delle famiglie
27 * Fonte: Registri ASIA Progetto ARCHIMEDE: Sistema informativo sulla condizione lavorativa Focus su lavoro autonomo: analisi territoriale* 2012
Archimede, il futuro Sistema Integrato dei Registri - SIR Progetto Archimede Progetto 'Costruzione e aggiornamento di basi di dati per l'analisi territoriale' Direzione Centrale 'Metodologia e disegno dei processi statistici’
5 Marzo 2007 Il modello generico del Sistema Integrato Registri Unità Variabili BaseEsteseTematiche X1X1 XiXi XnXn Y1Y1 YiYi YnYn Y’ 1 Y’ i Y’ n Z1Z1 ZiZi ZnZn Z’ 1 Z’ i Z’ n U1U1 …….. UiUi UmUm U m+1 …….. U m+i …….. U m+p …….. U m+p+i RSBase Pop. Stat. 1 Pop. Stat. 2 RSEstesi RSTematici
30 Grazie per l’attenzione