ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy COMPORTAMENTI INDIVIDUALI E RELAZIONI SOCIALI IN TRASFORMAZIONE UNA SFIDA PER LA STATISTICA UFFICIALE 23 GIUGNO | G. Garofalo, M. R. Simeone| Istituto Nazionale di Statistica
ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy 2 50 anni dopo ……. Il SIM SIM LUOGHI INDIVIDUI SIM INDIVIDUI SIM RELAZIONI TRA INDIVIDUI SIM LUOGHI UNITA’ ECONOMICHE SIM UNITA’ ECONOMICHE SIM RELAZIONI TRA UNITA’ ECONOMICHE SIM RELAZIONI INDIVIDUI UNITA’ Repository dei dati amministrativi e statistici integrati, organizzato con lo scopo di supportare i processi di produzione statistica dell'Istat. Favorisce l’utilizzo di dati individuali, privi degli identificativi diretti, mantenendo inalterate le potenzialità informative derivanti dal processo di integrazione..
ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy 3 …..a paradigm change in which statistical agencies design and update their flagship programs by determining the best combination of data sources and methods to serve user needs in a topic area of ongoing importance. This multiple sources paradigm should apply to all statistical programs, whether traditionally based on a survey, administrative records, or another source (Costance Citro,St. Canada) Multiple integrated data collection Fonti PrimarieFonti Secondarie Indagini statisticheFonti amministrative Migl. Processi di produzione Informazione ausiliaria nella fase di controllo dei dati Stima di singole variabili Da …………. a Fonti Ammin. integrate Indagini statistiche BIG DATA WEB Scraping Scanner data Call Details Record Informazioni non strutturate
ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy 4 La «conta» delle popolazioni Uso dell’indagine censuaria (pop. Residente/pendolarismo): Costi Ritardi nella diffusione Comportamenti «anagrafici distorti» dei rispondenti Impossibilità di analisi longitudinali Integrazione più fonti amministrative: Informazioni «amministrative distorte» Parzialità dell’informazione disponibile Difficoltà a stimare la «frequenza» dell’uso di un territorio Call Detail Record: Incertezza della popolazione di riferimento Impossibilità nella «qualificazione» Impossibilità di stimare le incoerenze fra chi «possiede» e chi «usa» il cellulare
ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy Interviene sui processi produttivi e organizzativi Si inserisce in una fase di evoluzione culturale nell’uso delle statistiche (Europa 2020, Beyond GDP,…) Determina la necessità, in atto ma ancora conclusa, di una profonda revisione della metodologia statistica (in particolare nella «interpretazione» e stima dell’errore) Permette una visione integrata di domini differenti e favorisce l’offerta di nuove informazioni statistiche. Multiple integrated data collection
ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy 6 Cosa cambia nel processo produttivo statistico Invesione delle fasi Collassamento nelle fasi Cosa cambia nel sistema organizzativo delle statistica pubblica Specialized corporate-level services units : Approccio “per funzioni centralizzate” a supporto di tutti i processi statistici e abbandono dei processi a “silos” (per singoli domini stat.). Maggiore standardizzazione e cooperazione.
ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy 7 Cosa cambia nell’approccio metodologico Valutazione errore Da un approccio da disegno 12..n12..n U 12...N12...N Sampling s Stima Ad un approccio da modello Realizzazione U.. Stima
ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy 8 Cosa cambia nella produzione statistica (pubblica!) Informazioni strutturate e complesse per intere popolazioni o sottopopolazioni (relazioni familiari + redditi + lavoro + istruzione + mobilità + …..) Più informazioni, per domini territoriali limitati e con maggiore tempestività Integrazione informativa – in input – fra più domini Domanda vs. offerta Imprese vs. famiglie Redditi vs lavoro Sviluppo (finalmente!) delle analisi longitudinali e dei percorsi di vita (es. istruzione/lavoro)
ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy E’ un processo evolutivo… … ma non è un processo reversibile Non è un processo a costo zero ! E’ un processo che presenta dei rischi «illusione informativa» / problema dei fiction data Moltiplicazione di rumori statistici non intercettati Garanzie per la privacy Multiple integrated data collection
ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy Garanzie per la privacy: il contesto generale recependo univoche indicazioni internazionali e comunitarie, il legislatore italiano ha riconosciuto nell’attività statistica pubblica tratti peculiari che la differenziano, negli scopi e nei metodi, da altre attività basate sul trattamento di dati personali, avendo come unico scopo quello di quantificare, classificare e produrre modelli interpretativi della realtà e delle sue tendenze evolutive e non il controllo degli individui. Da qui il riconoscimento ai produttori di statistiche ufficiali di una serie di importanti “deroghe” a limiti e prescrizioni non giustificati da un effettivo rischio per i diritti e le libertà degli interessati (ad esempio in materia di informativa, esercizio dei diritti degli interessati, conservazione dei dati, legittimazione al trattamento di dati sensibili e giudiziari). L'ordinamento statistico (nazionale e europeo) promuove e favorisce l’utilizzo e l’integrazione di fonti di dati alternative alle tradizionali rilevazioni statistiche, anche al fine di ridurre l'onere per i rispondenti: si tratta di una scelta obbligata per tutti gli Istituti nazionali di statistica (cfr. Reg. UE 2015/759 del 29 aprile 2015). e la specificità della statistica pubblica
ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy Garanzie per la privacy: quali rischi?.... «Attraverso l'utilizzo di dati amministrativi e fonti statistiche …vengono... ricostruite le connessioni logiche esistenti fra le singole unità, sfruttando i codici d'identificazione univoci delle persone fisiche……, arrivando così a profilare l'intera cittadinanza in relazione ad ogni aspetto della vita quotidiana in prospettiva diacronica, ivi compresa la relativa posizione geografica» (cfr. Parere del Garante per la protezione dei dati personali sullo schema di Programma statistico nazionale - Psn – del 29/10/2015)
ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy Garanzie per la privacy: gli strumenti messi in atto Il complesso di misure fisiche, logiche, organizzative e procedurali messe in atto nei processi di produzione statistica, in coerenza con il quadro normativo vigente in materia di tutela del segreto statistico e protezione dei dati personali, può offrire soluzioni idonee a fronteggiare tali maggiori rischi per la riservatezza. D’altra parte il processo «centralizzato» sviluppato dall’Istituto è garanzia per la trasparenza delle procedure di conservazione, accesso e utilizzo dei dati,….. …… ma non solo, permette un controllo volto a garantire un uso «parsimonioso» di tali dati e proporzionato agli obiettivi che si intendono perseguire. e per i Big Data? I BD non rappresentano una specifica categoria di informazioni assoggettata ad una disciplina speciale. Pertanto, considerata la loro eterogeneità è necessario verificare, di volta in volta, la sussistenza dei presupposti per il legittimo trattamento dei dati e adottare le garanzie prescritte in relazione ai tipi di dati (ad esempio sensibili), agli obiettivi che si intendono perseguire e alle modalità del trattamento.
ROMA 23 GIUGNO 2016 AREA TEMATICA 4. NUOVE FONTI E DOMANDE L’integrazione di basi di dati per la statistica pubblica: opportunità per la conoscenza e per l’efficienza e garanzie per la privacy Garanzie per la privacy: nuove opportunità nel quadro delle riforma legislative in atto Il sistema legislativo nazionale sulla privacy sarà sottoposto a rilevanti trasformazioni per effetto del recente regolamento UE n. 2016/679 che aggiorna e modernizza i principi contenuti nella direttiva sulla protezione dei dati personali del 1995 (Direttiva 95/46/CE). L’ordinamento del Sistema Statistico Nazionale è in fase di revisione. In questa nuova stagione di riforme potrebbero essere mature le condizioni per ripensare e far evolvere alcune regole legate a meccanismi procedurali ormai obsoleti e rivelatisi farraginosi (si pensi all’iter di approvazione del Psn) che rappresentano un ostacolo alla gestione flessibile ed efficiente di processo di produzione e diffusione dell’informazione statistica in forte rinnovamento.