La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Problemi di copertura e gestione della qualità dei dati in Whip Roberto Quaranta * *contatti

Presentazioni simili


Presentazione sul tema: "Problemi di copertura e gestione della qualità dei dati in Whip Roberto Quaranta * *contatti"— Transcript della presentazione:

1 Problemi di copertura e gestione della qualità dei dati in Whip Roberto Quaranta * *contatti

2 Problemi di copertura e gestione della qualità dei dati in Whip WHIP è una banca dati di storie lavorative. Permette di studiare i fenomeni socio-economici legati al mercato del lavoro. Tempi di rientro nelloccupazione dipendente Italia

3 Transizioni tra lavoro dipendente e altre gestioni Individui sopra i 50 anni Transizioni tra lavoro dipendente e altre gestioni Individui sopra i 50 anni Turnover, tassi di associazione, separazione e gwt negli anni

4 Per far questo è importante affrontare e definire il tipo di copertura e la gestione della qualità dei dati definire bene di chi e di quali storie lavorative stiamo parlando garantire uninformazione coerente e allo stesso tempo che permetta un utilizzo agevole da parte del ricercatore

5 I dati che permettono la costruzione di WHIP sono di natura amministrativa e provengono dallINPS. I dati che ci vengono forniti non sono raccolti per scopi di ricerca ma per scopi gestionali e amministrativi. Chi è presente è definito per legge, le leggi possono cambiare. Le informazioni contenute sono stabilite da normative, circolari... Non tutte le informazioni raccolte servono agli scopi amministrativi e gestionali

6 WHIP da dove nasce... La fonte originaria dei dati è costituita dagli archivi amministrativi dellInps, dai quali viene estratto un ampio campione casuale di record (1/90). le informazioni presenti riguardano gli individui che nellarco della loro vita lavorativa e di pensionamento hanno avuto rapporti con Inps. … perché hanno versato contributi per la pensione … perché percepiscono delle prestazioni pensionistiche (trattamenti diretti, assegni di invalidità …) e non pensionistiche (sussidio di disoccupazione, mobilità …) La fonte originaria dei dati è costituita dagli archivi amministrativi dellInps, dai quali viene estratto un ampio campione casuale di record (1/90). le informazioni presenti riguardano gli individui che nellarco della loro vita lavorativa e di pensionamento hanno avuto rapporti con Inps. … perché hanno versato contributi per la pensione … perché percepiscono delle prestazioni pensionistiche (trattamenti diretti, assegni di invalidità …) e non pensionistiche (sussidio di disoccupazione, mobilità …)

7 WHIP contiene... Adesso... Episodi di lavoro parasubordinato Episodi di disoccupazione (sussidiate) Episodi di mobilità Episodi di lavoro dipendente nel settore privato Attività di lavoro autonomo (artigiano e commerciante) Episodi di pensionamento erogate dallInps In futuro... Episodi di LSU (lavori socialmente utili) CIG Casellario delle pensioni

8 Mancano... Gli episodi lavorativi da dipendente pubblico quasi tutti gli agricoli Gli episodi lavorativi da liberi professionisti dotati di una cassa previdenziale autonoma (notai, avvocati,...)

9 La banca dati WHIP deve permettere di effettuare delle analisi socio-economiche, per fare questo si deve fare in modo che loggetto che si vuole studiare sia ben definito. La banca dati deve essere costruita da un campione rappresentativo delloggetto danalisi. Per fare questo si deve passare da una popolazione Inps ad una popolazione adatta ad indagini di tipo statistico – economico si devono armonizzare le informazioni in particolare le informazioni che riguardano i lavoratori dipendenti Perché non tutti presenti in INPS restringendo il nostro interesse al settore PRIVATO non agricolo.

10 Uniformiamo i dati prendendo solo alcuni settori (Ateco81). Non consideriamo: Settore Agricolo e Enti e aziende pubbliche 92 Servizi d'igiene pubblica ed amministrazione di cimiteri 93 Istruzione 95 Sanità e servizi veterinari 96 Altri servizi sociali

11 Pubblicazione rapporti di lavoro ricostruiti Periodo 1985 – 1999 RL ricostruitiRL presenti in WHIP Eliminati circa il 22%

12 Enti ed imprese con prestazioni pensionistiche alternative e/o sostitutive allINPS Entepresenti anche nellINPSnel campo di osservazione n. dipendenti (assicurati) FS (ferrovie dello stato)NOSI ( ) IPOST (istituto postelegrafonici)NO (SI solo contratti a tempo determinato) SI ( ) ANAS (confluita nella CTRS INPDAP dal 1996)NO, (Si solo i nuovi assunti dal 1997) SI9.261 ( ) INPGI (Giornalisti)SI - assicurati per fondi minoriSI ( ) INPDAI (dirigenti di aziende industriali)SI - assicurati per fondi minoriSI ( ) Fondo nazionale previdenza impiegati imprese di spedizione e agenzie marittime IPSMA) SI - assicurati per fondi minoriSI ( ) ENPALS (lavoratori dello spettacolo)in parte assicurati per fondi minori NO ( ) Altri Enti di minore dimensione (*)NOSI 300 circa ENPAIA, Ente naz. prev. Addetti impiegati agricoli NO ( ) ENAV, Ente nazionale di assistenza al voloNO, Si solo i nuovi assunti dal 1997, il resto Tesoro SI ( ) Fondo previdenza personale INA?SI 681 ( ) INPDAP-INS (asilo e scuole elementari parificate) NO ( ) Documento ISTAT: L'utilizzo dei dati INPS per la stima trimestrale del numero dei dipendenti, le retribuzioni, il costo del lavoro e le ore lavorate

13 Gestione della qualità dei dati e successiva pubblicazione La gestione della qualità è eseguita in due fasi: IN ENTRATA - ricezione e lavorazione dei dati si raccolgono: informazioni sugli archivi e sulle variabili informazioni normative e altro informazioni sulle codifiche dei dati individuazione dati mancanti e/o scorretti e gestiscono le informazioni mancanti e quelle scorrette IN USCITA - fase di pubblicazione si ricodificano le informazioni, le informazioni mancanti e/o scorrette si integrano, si correggono o si evidenzia che linformazione è mancante

14 Lanalisi di qualità dei dati ricevuti e la ricodifica delle informazioni Lanalisi di qualità dei dati ricevuti e la ricodifica delle informazioni La procedura di costruzione di WHIP può esser vista come una scatola nera che prende in input gli archivi forniti da Inps, li elabora, e restituisce come risultato degli archivi che rispondono a finalità di analisi statistico-economica. Le operazioni fondamentali della procedura sono: La normalizzazione, pulizia e ricodifica L'identificazione longitudinale delle imprese L'identificazione longitudinale dei rapporti di lavoro Il consolidamento dei record contributivi in dati annui dei rapporti di lavoro

15 ricezione dei datiraccolta documentazione analisi qualità dei dati ricodifica delle informazioni Archivi forniti da Inps identificazione longitudinale delle imprese identificazione longitudinale dei rapporti di lavoro archivio di storie lavorative documentazione on line Inputs Outputs

16 ricezione degli archivi sorgente raccolta documentazione analisi qualità dei dati ricodifica delle informazioni Le Istruzioni di compilazione dei moduli Inps Le Circolari Inps I CUD e la normativa Personale INPS Normalizzazione, pulizia e ricodifica Codifica Correzione Ricodifica

17 Lanalisi di qualità dei dati ricevuti ricodifica delle informazioni Lanalisi di qualità dei dati ricevuti ricodifica delle informazioni Gestiamo: valori mancanti codici non riconosciuti Gestiamo: valori mancanti codici non riconosciuti archivi sorgente codifiche

18 Variabile: Qualifica Inps (originale) Valori Frequenze % V. cumulati % ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ D O R S T W X Y Valori missing 493 Esempi di correzione e ricodifica

19 Qualifica Inps (ricodificata) codifica variabile, ricodifica e segnalazione informazioni mancanti e non corrette Valori Frequenze % V. cumulati % ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ ood missing 493

20 Correzione mesi retribuiti - dicembrini Tipo correzioneN N totale 1985dicembrini319mm_retribuiti dicembrini302mm_retribuiti dicembrini324mm_retribuiti dicembrini361mm_retribuiti dicembrini286mm_retribuiti dicembrini330mm_retribuiti dicembrini319mm_retribuiti dicembrini248mm_retribuiti dicembrini256mm_retribuiti dicembrini210mm_retribuiti dicembrini203mm_retribuiti dicembrini185mm_retribuiti dicembrini223mm_retribuiti dicembrini183mm_retribuiti dicembrini207mm_retribuiti

21 annoosservazioniimputazioni Correzione codice contratto

22 annoosservazioniimputazioni Correzione Inquadramento

23 Valori originali Frequenze ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ / L ^ ^LI GR L LI Inquadramento: Situazione iniziale ancora...

24 2 LV ' 'L L /L B D L LIV O ^ ^L D D DIR DIR DOM E/ EP II IM L L L L.DO L L L L LD LV OP QD V

25 Risultato finale Valori Frequenze % V. cumulati % ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Missing 105

26 Correzione Retribuzione Numero di correzioni fatte su ogni anno o1m_1985retribuzione 4 o1m_1986retribuzione 2 o1m_1987retribuzione 7 o1m_1988retribuzione 1 o1m_1989retribuzione 2 o1m_1990retribuzione 1 o1m_1991retribuzione 0 o1m_1992retribuzione 0 o1m_1993retribuzione 3 o1m_1994retribuzione 1 o1m_1995retribuzione 2 o1m_1996retribuzione 0 o1m_1997retribuzione 3 o1m_1998retribuzione202 o1m_1999retribuzione134 Sembrano poche correzioni

27 1997 Variabile media Std Dev Maximum ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ comp_correnti comp_altre ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 1998 Variabile media Std Dev Maximum ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ comp_correnti comp_altre ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ 1999 Variabile media Std Dev Maximum ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ comp_correnti comp_altre ƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒƒ Correzione Retribuzione

28 Lanalisi di qualità dei dati pubblicati In fase di pubblicazione vengono eseguiti ulteriori controlli: sui dati mancanti sui dati scorretti

29 AnnoImputazioni % % % Provincia di lavoro... Correzioni meno consistenti... e più consistenti:

30 annoosservazioni missingimputazioni Correzione codice contratto

31 annoosservazioni missingimputazioni Correzione Inquadramento

32 Serve per poter avere dati di impresa affidabili (e di conseguenza anche per poter identificare i rapporti di lavoro) E necessaria perché WHIP ha una dimensione longitudinale che è ben superiore al numero di anni (cinque) per i quali l'Inps costruisce i record dell'Osservatorio delle Imprese, dal quale è estratto il campione oggetto di fornitura. Tra edizioni successive dell'Osservatorio possono cambiare i codici identificativi delle imprese, e può cambiare la composizione stessa dell'impresa per scorpori, fusioni e altre trasformazioni societarie. L'identificazione longitudinale delle imprese e delle trasformazioni societarie

33 Non esistendo una relazione uno a uno tra gli episodi di contribuzione dichiarati e rapporti di lavoro instaurati dalla persona (la relazione è del tipo molti a molti). Non è registrata esplicitamente una data di inizio del rapporto di lavoro, e la data di cessazione - seppur presente - è di qualità carente, sia in termini di valori missing che di valori scorretti L'identificazione longitudinale dei rapporti di lavoro

34 Impatto della ricostruzione sulla identificazione dei rapporti di lavoro Periodo RL ricostruiti Ricuciture (almeno * 2 rl) 1 - passaggio diretti in un intervallo breve - 76% di cui il 40% nella stessa impresa, 10% nella stessa posizione, 50% è un flusso spurio 2 – uguale al 1 ma con intervallo maggiore senza altri rapporti di lavoro - 10% (il 99% nella stessa impresa) 3 - buchi dicembre-gennaio - 10% (il 99% nella stessa impresa) 4 - militari – 5% (il 99% nella stessa impresa)


Scaricare ppt "Problemi di copertura e gestione della qualità dei dati in Whip Roberto Quaranta * *contatti"

Presentazioni simili


Annunci Google