La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Principali innovazioni e risultati del Censimento Censimento dell’industria e dei servizi 2011 ANDREA MANCINI Direttore del Dipartimento per i Censimenti.

Presentazioni simili


Presentazione sul tema: "Principali innovazioni e risultati del Censimento Censimento dell’industria e dei servizi 2011 ANDREA MANCINI Direttore del Dipartimento per i Censimenti."— Transcript della presentazione:

1 Principali innovazioni e risultati del Censimento Censimento dell’industria e dei servizi 2011 ANDREA MANCINI Direttore del Dipartimento per i Censimenti e i registri amministrativi e statistici, Istat L’informazione statistica come base per la ricerca economica e sociale Andrea Mancini UNIVERSITA’ DI CASSINO - 17 novembre

2 Tradizionalmente l’informazione statistica ufficiale è basata su dati elementari che vengono raccolti mediante rilevazioni di due tipi: Censuarie : I dati relativi alle variabili quantitative e qualitative vengono rilevati con un questionario distribuito a tutte le unità che appartengono alla popolazione di riferimento (famiglie, individui, istituzioni, aziende agricole, imprese, ecc) Campionarie: I dati vengono rilevati con un questionario distribuito a un campione di unità estratto casualmente secondo un disegno campionario predeterminato (semplice, stratificato, a uno stadio, a più stadi) dall’universo della popolazione rilevata al censimento e riportati a questo universo mediante coefficienti di espansione Quindi i censimenti sono sempre stati usati per realizzare I denominatori degli indicatori statistici; questi ultimi sono i macro dati da diffondere

3 Con lo sviluppo delle ICT si sono rese disponibili altre fonti di dati elementari riferiti alle unità che costituiscono le popolazioni di riferimento della statistica ufficiale Archivi amministrativi: creati dalle Pubbliche Amministrazioni per gestire i procedimenti amministrativi contengono informazioni sulle unità elementari e sugli eventuali trattamenti o interventi pubblici cui esse sono sottoposte. Grazie ai codici identificativi unici (es. Cod. Fisc.) obbligatori in tutti gli archvi amministrativi le informazioni riferite ad una stessa unità possono essere integrate tra loro per usi statistici. Big data: data sets massivi derivanti dale trace digitali prodotte dale attività umane (open linked data, web activities data, social network data, phone data, navigation GPS data, transaction data, tourism related data) Le informazioni tratte da queste due fonti possono essere trasformate in dati statistici elementari (definizioni e classificazioni statistiche) al fine di: -realizzare e aggiornare Registri Statistici delle unità di interesse, sostitutivi dei censimenti -Controllare la qualità dei dati rilevati a campione (variabili ausiliarie) -Sostituire alcuni quesiti nei questionari delle rilevazioni campionarie

4 anni ’90: l’Istat, grazie al codice fiscale univoco realizza il REGISTRO STATISTICO delle IMPRESE ATTIVE (ASIA) aggiornato annualmente mediante integrazione dei dati elementari contenuti in archivi amministrativi fiscali, previdenziali, delle Camere di commercio, ecc anni 2000: ASIA sostituisce il censimento decennale delle imprese. Vengono creati il registro statistico dei gruppi di imprese e quello delle unità locali delle imprese, nonchè i registri satellite delle imprese a controllo pubblico, dei punti di vendita anno 2011: il censimento della popolazione viene realizzato per la prima volta partendo dalle LISTE ANAGRAFICHE COMUNALI. La rilevazione sul campo serve a validare le anagrafi comunali mediante un Sistema web (SGR) di confronto contestuale tra dati individuali di censimento e di anagrafe. A fine censimento l’Istat produce e fornisce a ciascun comune 2 liste nominative di individui: -Iscritti in anagrafe non trovati al censimento (possibile errore di sovracopertura dell’anagrafe) -Trovati al censimento ma non ancora iscritti in anagrafe (posibile errori di sottocopertura dell’anagrafe) Queste 2 liste sono usate da ciascun comune per effettuare la revisione postcensuaria delle anagrafi in un sistema web (SIREA) fornito dall’Istat

5 Al centro dei programmi di innovazione in corso di realizzazione in Istat ci sono 4 progetti 2 Sistemi di base per l’integrazione di dati SIM: Sistema Integrato di Microdati sulle unità statistiche socio-demografiche ed economiche ANNCSU: Archivio Nazionale dei Numeri Civici delle Strade Urbane 2 Sistemi per la produzione di dati integrati Censimento permanente popolazione e abitazioni ARCHIMEDE: Archivio integrato di microdati economici e demosociali (da fonti amministrative)

6 SIM: Sistema Integrato di Microdati sulle unità statistiche socio-demografiche ed economiche E’ una infrastruttura statistica di base nella quale vengono integrati dati riferiti a individui, famiglie e unità economiche provenienti da una pluralità di basi dati di fonte amministrativa e da rilevazioni statistiche Include dati relativi a: - Caratteristiche di individui e famiglie (es. occupazione, titolo di studio); -Luoghi di residenza, lavoro, studio, ecc. ; -Tipologie di relazioni tra individui, unità economiche e luoghi

7 In SIM l’integrazione avviene: Identificando ciascuna entità (famiglia, individuo, unità economica e loro relazioni) nelle diverse fonti mediante un ID number unico e stabile nel tempo Definendo per ciascuna entità le relazioni logiche e fisiche (nel tempo e nello spazio) che intercorrono tra le informazioni ad essa riferite e nelle varie fonti.

8 SIM produce: Strutture di dati riferiti a unità elementari appartenenti a specifiche popolazioni di interesse statistico utili per : realizzare e aggiornare registri statistici realizzare sottosistemi di informazioni statistiche dedicate a lavoro, mobilità, istruzione, reddito, ecc. dare supporto alle rilevazioni statistiche (ad es. per stratificare campioni o fornire variabili ausiliare o integrative)

9 A fine 2013 nei 7 sottosistemi del SIM erano integrati: attualmente integrati: Sottosistemi SIMN. di archivi Anni di copertura ∑ di unità presenti nelle singole fonti per anno (milioni) % SIM-unità economiche ÷201274,977,6 SIM-Individui422009÷ ,569,0 SIM-Luoghi degli individui ÷ ,220,7 SIM-Luoghi delle unità economiche ÷201230,739,7 SIM-Relazioni tra unità economiche ÷201225,029,3 SIM-Relazioni tra individui e unità economiche ÷ ,048,3 SIM-Relazioni tra individui 52011;201336,88,6 Numero complessivo di archivi in SIM 58 I sottosistemi realizzati e in fase di sviluppo

10 SIM Economic Units SIM individuals SIM. individuals' places ARCHIMEDE Mobilità quotidiana studenti/lavoratori SIM. E.U. places SIM I.=>E.U. rel SIM I.=>I. rel SIM E.U=> E.U. rel ARCHIMEDE Condizioni di precarietà e redditi delle famiglie Job rel. ARCHIMEDE Analisi panel mobilità nell’impiego e mutamenti di stato contrattuale e/o professionale ARCHIMEDE Analisi panel mobilità nell’impiego e mutamenti di stato contrattuale e/o professionale Cosa si produce già con il SIM ASIA-gruppi Asia – unità locali ASIA- Imprese pubbliche ASIA-gruppi Asia – unità locali ASIA- Imprese pubbliche ASIA-Occupazione ASIA- imprese Var. aus. Ril. sbocchi occ. laureati

11 Creazione Archivio Nazionale degli Stradari e dei Numeri Civici – ANSC in occasione del XV Censimento Popolazione e Abitazioni COMUNI Catasto indirizzi unità immobiliari Fonti esterne stradari 509 Comuni Comuni SGR EDI RNC Archivio di indirizzi di individui/famiglie in popolazione Archivio di indirizzi reperiti da censimento degli edifici Rilevazione di controllo dei Numeri Civici (509 Comuni) Disallineamenti Archivi comunali Delibere Archivio Nazionale degli Stradari e dei Numeri Civici Operazione di Aggiornamento e consolidamento in corso Operazione di Certificazione Operazione di linkage Completata al 100% < abitanti Capoluoghi e > abitanti ANSC SW di verifica ed aggiornamento SW di certificazione

12 Indirizzario SGR Indirizzario EDI Indirizzario RNC 509 comuni Indirizzario ANSC ( ) comuni 11,5 milioni ISTAT Agenzia Entrate 9,5 milioni 16,6 milioni Archivio integrato dei numeri civici di tutti i Comuni Verso l’Archivio Nazionale dei Numeri Civici delle Strade Urbane Operazione di linkage (oltre 26 milioni) Da ANSC a ANNCSU Consolidamento dell’ANSC in ANNCSU, mediante l’integrazione degli archivi

13 NORMATORE REGISTRICOMUNALI DIZIONARI Componenti e macrofunzioni di ANNCSU Tenuta, aggiornamento e compilazione registri Data entry e certificazione; Consultazione archivi Registro comunale delle strade e dei numeri civici METODI E NORME Dizionario delle DUG e delle denominazioni Normalizzazione e matching; Geocodifica alle sezioni di censimento Istruzioni per stradari e indirizzari ANNCSU

14 IL NORMATORE Cosa fa: è lo strumento informatico di certificazione dello stradario e indirizzario comunale che garantisce la coerenza alle regole e disposizioni definite da ISTAT in «Metodi e Norme»; consente la conversione di un indirizzo nel suo formato standard Funzioni principali: acquisizione; analisi; correzione; normalizzazione e geocodifica a sezioni di censimento; validazione; consultazione; download Chi lo usa: -i comuni per aggiornare lo stradario e indirizzario e tutti gli altri propri archivi amministrativi (anagrafe, tributi ecc.) -Gli enti pubblici per gestire i propri archivi e permettere il linkage per indirizzo -I soggetti pubblici e privati per consultazione e richiesta dati

15 IL NORMATORE: la funzione di matching Il processo di elaborazione del NORMATORE si fonda sul record linkage tra l’indirizzo da elaborare (input) e un suo possibile corrispondente nel dizionario o in un archivio amministrativo (Comune, Ente Pubblico, ecc.) grazie a algoritmi di correlazione e di contenutistica con i quali si ricerca il toponimo dapprima identico (matching deterministico) e, successivamente, somigliante (matching probabilistico) a quello in input. Matching deterministico: Perfetto record linkage, sia sintattico che semantico, in ognuno dei campi del toponimo (Specie e Denominazione), tra il toponimo in input e il toponimo presente all’interno dell’archivio Matching probabilistico: Si stima la probabilità che un toponimo sia riconducibile ad un elemento del Dizionario/Registro comunale, anche se è scritto sintatticamente in modo differente, ma semanticamente è uguale. Via Giuseppe GaribaldiVIA GIUSEPPE GARIBALDI GARIBALDIG V.le G. GaribaldiVIALE GIUSEPPE GARIBALDI GARIBALDI Viale Garibaldi GiuseppeVIALE GIUSEPPE GARIBALDI GARIBALDI

16 IL NORMATORE: l’output Il risultato degli archivi elaborati dallo strumento sarà: Coerente con Metodi e Norme dettate dall’ISTAT; Standardizzato rispetto alla banca dati di ANNCSU; Indicherà la presenza/assenza dell’indirizzo o del toponimo all’interno del territorio di un Comune. In caso di presenza: restituisce il toponimo certificato dal comune In caso di assenza: restituisce possibili toponimi, identici o somiglianti presenti nella banca dati nazionale Permette la geocodifica del singolo indirizzo comunale cioè la sua associazione alla corrispondente sezione di censimento

17 Progetto ARCHIMEDE Obiettivo: ampliamento dell’offerta informativa dell’ISTAT mediante produzione di collezioni di dati elementari di tipo longitudinale (ad es. percorsi sociali ed economici) e crossection, da rendere disponibili alla ricerca sociale ed economica, alla programmazione territoriale e settoriale, alla valutazione delle politiche pubbliche a livello nazionale, regionale e locale. Valorizzare i contenuti informativi di fonti amministrative «integrate» presenti in SIM. Invertire il flusso delle informazioni elementari (esclusivamente per finalità statistiche) dall’Istat ad altri enti pubblici. Riutilizzare metodi, modelli e «sintassi» già sviluppati dentro e fuori dell’ISTAT. 17

18 Replicabili (industrializzati ) Replicabili (industrializzati ) Documentati qualità contenuti Documentati qualità contenuti Territorio: Informazioni geo referite Tempo: Informazioni longitudinali Territorio: Informazioni geo referite Tempo: Informazioni longitudinali Progetto ARCHIMEDE – Caratteristiche (1/2) Sistema Integrato dei Microdati Progetto Archimede Esplora Produce Output informativi statistici Collezioni di microdati integrati Collezioni di macrodati Utenti interni Utenti esterni Livello di autonomia degli utenti 18

19 Output informativi statistici Generalizzati: realizzazione di offerte informative identificate sulla base delle potenzialità informative di SIM Fare riferimento ad un insieme di unità che possono non rappresentare l’universo di una specifica popolazione Utilizzare dati amministrativi di SIM anche non trattati statisticamente Integrare anche basi informative fornite da utenti esterni (es. Comuni/Regioni) Utilizzare concetti non necessariamente coerenti con la statistica ufficiale (es. Regolamenti europei) Progetto ARCHIMEDE – Caratteristiche (2/2) 19 On demand: realizzati in base a specifiche esigenze informative di utenti

20 Classificazione socio-economica delle famiglie secondo le dimensioni: Tipologia della famiglia (integrazione fra anagrafi e familiari a carico da dich. fiscali) Reddito (integrazione dei redditi a tass. ordinaria con redditi esenti) Condizione lavorativa Disagio (disabilità, pensioni al minimo, cittadinanza) Istruzione Valutazione dell’utilizzo di tecniche tipo Data Mining Classificazione socio-economica delle famiglie secondo le dimensioni: Tipologia della famiglia (integrazione fra anagrafi e familiari a carico da dich. fiscali) Reddito (integrazione dei redditi a tass. ordinaria con redditi esenti) Condizione lavorativa Disagio (disabilità, pensioni al minimo, cittadinanza) Istruzione Valutazione dell’utilizzo di tecniche tipo Data Mining Mobilità sul territorio Realizzazione Sis. Inf. Persons&Places Identificazione delle tipologie di «city users»: Residenti Temporaneamente dimoranti Pendolari Per risolvere la mancanza di informazioni sulla «frequenza» di accesso ad un territorio: Utilizzo di BIG DATA – Call Data Records Sviluppo di modelli che utilizzano «distanze» Mobilità sul territorio Realizzazione Sis. Inf. Persons&Places Identificazione delle tipologie di «city users»: Residenti Temporaneamente dimoranti Pendolari Per risolvere la mancanza di informazioni sulla «frequenza» di accesso ad un territorio: Utilizzo di BIG DATA – Call Data Records Sviluppo di modelli che utilizzano «distanze» Sotto Progetto 2 Precarietà Lavorativa Sotto Progetto 3 Precarietà Socio-economica delle famiglie Sotto Progetto 1 Popolazione Insistente Progetto ARCHIMEDE 20 Tre sperimentazioni

21 provincia di Pisa per Studenti primarie e secondarie Studio Residenza … Totale residenti studenti ……………. 1……. Monteverdi Marittimo Montopoli in Val d'Arno Orciano Pisano Palaia Peccioli Pisa Pomarance Ponsacco Pontedera Riparbella San Giuliano Terme San Miniato Santa Croce sull'Arno Santa Luce Santa Maria a Monte Terricciola Vecchiano Vicopisano Volterra Totale studenti iscritti Sottoprogetto 1: matrice OD prov. Pisa di studenti prim. e sec.

22 Lavoratori residenti a Milano per luogo di Lavoro, e non residenti a Milano che lavorano a Milano – Anno 2011 (esclusivamente fonti amministrative integrate in SIM) Luogo di Residenza Luogo di Lavoro Milano comune Entro la Provincia Fuori Provincia Fuori Regione Totale Milano comune Entro la Provincia Fuori la Provincia Fuori Regione Totale Residenti stanziali a Milano Non residenti in entrata a Milano Residenti in uscita a Milano Sottoprogetto 1: matrice OD Comune di Milano lavoratori

23 Lavoratore precario: individuo che, in un determinato periodo di tempo, svolge esclusivamente lavori definiti «precari» Condizione: -Lavoratore precario -Lavoratore stabile -Altra condizione: o Disoccupato / studente / … o Inabile al lavoro o Pensionato o Deceduto o Emigrato -Intensità del fenomeno -Transizioni Campo di osservazione: lavoratori che svolgono uno o più lavori precari Pluricommittenza / Reddito / Istruzione Cassa integrazione Uscita volontaria Precarietà Lavorativa – Definizioni (4/4) Sottoprogetto 2: Precarietà lavorativa

24 Precarietà Lavorativa - Fonti SIM E-Mens DMAG Ex ENPALS CIG pag. diretto Parasubordinati Fonti su lav.ri Indipendenti Ex INPDAP Lav. Domestici Aut. Agricoltura Altre fonti ASIA OCCUPAZIONE CIS Fonti integrate per il progetto Precarietà Lavorativa (Fonti amministrative sull’occupazione) Sottoprogetto 2: Le fonti

25 Fonti individuateN. record 2011N. CF distinti 2011 ASIA - Occupazione Posizioni Assicurative Ex INPDAP Autonomi Agricoltura Fonti standardizzate N. Record (ottobre) N. CF distinti ASIA - Occupazione Posizioni Assicurative Ex INPDAP Autonomi Agricoltura Output 2N. record = N. CF occupati ASIA - Occupazione Posizioni Assicurative Ex INPDAP Autonomi Agricoltura Output 1N. record ASIA - Occupazione Posizioni Assicurative Ex INPDAP Autonomi Agricoltura Attività: -Missing data -Selezione variabili utili e comuni -Analisi lavoratori interinali e CIG -Mese di riferimento: ottobre Integrazione Standardizzazione Condizione principale Contenuti - Occupati nel periodo di riferimento: -occupato -attività lavorativa principale -datore di lavoro (att. lav. princ.) -caratteristiche lavorative (att. lav. princ.) -quota lavorata nel periodo (att. lav. princ.) -quota lavorata complessiva nel periodo -numero di attività lavorative -numero di datori di lavoro Contenuti - Attività lavorative svolte da ogni individuo nel periodo di riferimento: -occupato -attività lavorativa (tipologia di prestazione) -datore di lavoro -caratteristiche lavorative -quota lavorata nel periodo Criterio di ordinamento della tipologia di prestazione: -Dipendente a tempo indeterminato -Autonomo -Dipendente a tempo determinato -Collaboratore Precarietà Lavorativa - Processo Periodo di riferimento: annualità Sottoprogetto 2: L’integrazione delle fonti

26 Precarietà Lavorativa – Primi risultati (1/4) Condizione Prestazioni lavorativeOccupati ottobre 2010 (Migliaia) Uscite (Migliaia) Entrate (Migliaia) Occupati ottobre 2011 (Migliaia) Stabile Dip.ti - T. indeterminato Full time Dip.ti - T. indeterminato Part time Autonomi Dip.ti non class.ti Precario Dip.ti - T. determinato Collaboratori Totale Di cui femmine Stabile Dip.ti - T. indeterminato Full time36,7%34,8%35,9%37,0% Dip.ti - T. indeterminato Part time76,5%64,6%58,4%76,1% Autonomi30,5%35,0%37,4%30,6% Dip.ti non class.ti78,2%66,9%69,6%78,2% Precario Dip.ti - T. determinato47,9%46,1%47,0%46,7% Collaboratori52,8%50,8%57,5%54,9% Totale40,8%41,6%43,8%41,1% Età media Stabile Dip.ti - T. indeterminato Full time42,143,135,742,5 Dip.ti - T. indeterminato Part time39,838,133,440,1 Autonomi46,748,541,947,1 Dip.ti non class.ti43,544,039,843,7 Precario Dip.ti - T. determinato36,436,033,736,3 Collaboratori38,540,733,437,6 Totale42,442,036,042,7 Sottoprogetto 2: Primi risultati (1)

27 Precarietà Lavorativa – Primi risultati (2/4) Analisi Longitudinale Condizione Precaria ? Ottobre 2010 Ottobre 2011 Totale (Migliaia) % Totale STABILE INDIP. e DIP. NON CIG STABILE DIP. CIG Dip.ti non classificati PRECARIO DIPENDENTE PRECARIO PARASUB.TO STABILE INDIP. e DIP. NON CIG 96,9%1,3%0,0%1,6%0,2% ,3% STABILE DIP. CIG 46,6% 47,6% 0,1%5,6%0,1%4862,5% Dip.ti non classificati 9,5%0,1%84,8%5,3%0,2%710,4% PRECARIO DIPENDENTE 34,7% 0,8%0,4%63,1%1,0%1.4287,2% PRECARIO PARASUBORDINATO 15,4% 0,1% 10,0% 74,5% 3191,6% % Totale89,5%2,4%0,4%6,3%1,4% ,0% Sottoprogetto 2: Primi risultati (2)

28 Il primo 5%: Redd. da lavoro > 37 mila euro Condizione Non Precaria ? Il primo 5%: Redd. da lavoro > 37 mila euro Condizione Non Precaria ? Precarietà Lavorativa – Primi risultati (4/4) Redditi mediani dei lavoratori dipendenti e assimilati (copertura: 98,2%) * * Fonte: BDR - MEF CONDIZIONEReddito da Lavoro Reddito complessivo al lordo delle deduzioni STABILE DIP. NON CIG STABILE DIP. CIG DIP. NON CLASSIFICATO PRECARIO DIPENDENTE PRECARIO PARASUBORDINATO Sottoprogetto 2: Primi risultati (3)

29 Le potenzialità di Archimede per la valutazione dell’efficacia delle politiche pubbliche con il metodo del controfattuale Nelle basi dati prodotte da Archimede sono disponibili microdati che consentono di individuare sottopopolazioni con caratteristiche predefinibili. Mediante le informazioni sulle caratteristiche demosociali e/o economiche associate a individuo o famiglia o unità economica si può distinguere un gruppo di soggetti sottoposti al trattamento di una politica e un gruppo non sottoposto al trattamento, entrambi composti da soggetti aventi caratteristiche «di partenza» analoghe. Principali informazioni disponibili per più anni sono di tipo: -Demografico (sesso, età, cittadinanza…) -Familiare (con minori, per n° di componenti …..) -Reddituale (lavoro, trasferimento monetario temporaneo, pensione ….) -Occupazionale (intensità di lavoro nell’anno, tipo di contratto …)

30 Lavoratori che hanno beneficiato dell’indennità di mobilità nell’anno t (informazione derivante dall’archivio dei Trattamenti Monetari non Pensionistici) Agevolazioni contributive per i datori che assumono lavoratori in mobilità (destinatari). Lavoratori associati ad un codice di agevolazione contributiva per l’assunzione (informazione derivante da DB occupazione) presso imprese private n° lavoratori in mobilità assunti nell’anno t+1 da imprese private, associati ad un codice di agevolazione (beneficiari) n° lavoratori in mobilità assunti nell’anno t+1 da imprese private, non associati ad un codice di agevolazione Il risultato può essere analizzato tenendo conto di possibili variabili e loro modalità (es. livello di istruzione, caratteristiche della famiglia) Popolazione obiettivoTrattamento Variabili-risultato Cambiamento di stato ottenuto in virtù della politica Un esempio di applicazione possibile Politiche per l’inserimento o per la riqualificazione professionale della popolazione obiettivo La dimensione temporale è da tenere sotto controllo: l’effetto della politica si rivela confrontando la differenza tra prima e dopo; per questo è necessario disporre di un intervallo temporale sufficientemente ampio

31 Censimento permanente: la D-sample Disegno Campionario Due stadi – Circa famiglie ogni anno Questionario Long Tecnica Paperless: CAWI e CAPI Sistema di Monitoraggio WEB (SGR)

32 D-sample. Piano di accumulazione dei dati per dimensione dell’area di output Dimensione dell’Area di Output (ab.) Numero di anni Intervallo di stima Anno centrale > t t t, (t-1), (t-2)(t-1) < t, (t-1), (t-2), (t-3), (t-4)(t-2)

33 D-sample. Il piano di diffusione


Scaricare ppt "Principali innovazioni e risultati del Censimento Censimento dell’industria e dei servizi 2011 ANDREA MANCINI Direttore del Dipartimento per i Censimenti."

Presentazioni simili


Annunci Google