La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio.

Presentazioni simili


Presentazione sul tema: "WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio."— Transcript della presentazione:

1 WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio Revelli e Università di Torino Moncalieri, 10 maggio 2007

2 Indice della presentazione Luso di dati amministrativi a fini scientifici Introduzione a Whip Dati e metadati: la fabbrica di Whip Luso di Whip per studi sul mercato del lavoro Luso di dati amministrativi a fini scientifici Introduzione a Whip Dati e metadati: la fabbrica di Whip Luso di Whip per studi sul mercato del lavoro

3 Luso di dati amministrativi a fini scientifici Tre tipi di dati per lo studio dei fenomeni sociali: Dati survey (field study) Dati sperimentali Dati amministrativi Tre tipi di dati per lo studio dei fenomeni sociali: Dati survey (field study) Dati sperimentali Dati amministrativi (poco diffusi) [ luso di dati amministrativi. intro ] [ 1 / 6 ]

4 [ luso di dati amministrativi. intro ] [ 2 / 6 ] Dati surveyDati amministrativi Viene rilevato esattamente il fenomeno di interesse Alta standardizzazione delle definizioni e delle codifiche a livello internazionale Elevato know how nel loro uso da parte della comunità scientifica Vengono raccolti a fini amministrativi, e non tutti gli aspetti interessanti per il ricercatore vengono rilevati Poco confrontabili a livello internazionale Spesso i ricercatori non sanno usarli Il fenomeno di interesse viene rilevato solo se cè una domanda di ricerca Molto costosi, in soldi e response burden scarsa estensione campionaria scarsa profondità temporale Vengono raccolti a prescindere da interessi di ricerca: si può interrogare la storia! Enormemente più economici che qualunque indagine CAPI/CATI

5 Principali esperienze italiane e internazionali Leader, nonché pionieri, sono la Finlandia e altri paesi nordici. Circa il 96% dei dati raccolti da Statistics Finland ha origine amministrativa. Archivi su tutta la popolazione, che coprono tematiche dal lavoro, alla famiglia, alla salute. Su base campionaria, dati su lavoratori e imprese sono utilizzati per scopi di ricerca ormai nei principali paesi sviluppati, presso gli Istituti nazionali di statistica (es: lInsee in Francia), gli Istituti previdenziali (es: la SSA negli Stati Uniti), centri di ricerca (ex: lo IAB in Germania). A livello OCSE, importante lavoro della Short-Term Economic Statistics (STES) Taskforce on Administrative Data, per larmonizzazione e standardizzazione delle metodologie In Italia, oltre a Whip e a panel cugini (quali CLAP o il panel Isfol-La Sapienza), sono da citare importanti esperienze per lanalisi di mercati del lavoro locali:. Il progetto Aspo (Archivio statistico provinciale per loccupazione). Il progetto AMeRIcA (Anagrafe Milanese e Redditi Individuali). Il progetto GIOVE (dati dei centri per limpiego) Leader, nonché pionieri, sono la Finlandia e altri paesi nordici. Circa il 96% dei dati raccolti da Statistics Finland ha origine amministrativa. Archivi su tutta la popolazione, che coprono tematiche dal lavoro, alla famiglia, alla salute. Su base campionaria, dati su lavoratori e imprese sono utilizzati per scopi di ricerca ormai nei principali paesi sviluppati, presso gli Istituti nazionali di statistica (es: lInsee in Francia), gli Istituti previdenziali (es: la SSA negli Stati Uniti), centri di ricerca (ex: lo IAB in Germania). A livello OCSE, importante lavoro della Short-Term Economic Statistics (STES) Taskforce on Administrative Data, per larmonizzazione e standardizzazione delle metodologie In Italia, oltre a Whip e a panel cugini (quali CLAP o il panel Isfol-La Sapienza), sono da citare importanti esperienze per lanalisi di mercati del lavoro locali:. Il progetto Aspo (Archivio statistico provinciale per loccupazione). Il progetto AMeRIcA (Anagrafe Milanese e Redditi Individuali). Il progetto GIOVE (dati dei centri per limpiego) [ luso di dati amministrativi. intro ] [ 3 / 6 ]

6 Definizione di dati amministrativi Secondo la STES Taskforce on Administrative Data i dati amministrativi son definiti dalle seguenti caratteristiche: [ luso di dati amministrativi. definizione e sfide ] [ 4 / 6 ] Lagente che fornisce i dati allagenzia statistica e lunità cui i dati si riferiscono sono di solito diversi, al contrario che nelle indagini survey ( non chiedo direttamente ad A, ma chiedo a B di riferirmi su A); I dati sono raccolti per un preciso scopo, non statistico, che potrebbe incidere sul trattamento della unità di indagine; lo scopo è una copertura completa della popolazione; il controllo dei metodi con cui i dati amministrativi sono raccolti e processati sono in capo alla agenzia amministrativa (e non allagenzia statistica) ( problema di comunicazione: non so come B abbia intervistato A). Lagente che fornisce i dati allagenzia statistica e lunità cui i dati si riferiscono sono di solito diversi, al contrario che nelle indagini survey ( non chiedo direttamente ad A, ma chiedo a B di riferirmi su A); I dati sono raccolti per un preciso scopo, non statistico, che potrebbe incidere sul trattamento della unità di indagine; lo scopo è una copertura completa della popolazione; il controllo dei metodi con cui i dati amministrativi sono raccolti e processati sono in capo alla agenzia amministrativa (e non allagenzia statistica) ( problema di comunicazione: non so come B abbia intervistato A). Aggiungiamo: Lagente che raccoglie i dati non è estraneo rispetto al fenomeno in esame Aggiungiamo: Lagente che raccoglie i dati non è estraneo rispetto al fenomeno in esame

7 Sfide, per i produttori di dati amministrativi Sempre secondo la STES, le principali sfide cui si trovano di fronte i produttori di dati amministrativi: [ luso di dati amministrativi. definizione e sfide ] [ 5 / 6 ] Timeliness (tempestività): i dati amministrativi sono in genere disponibili troppo lentamente perché possano essere usati direttamente per produrre statistiche di breve termine, vale a dire come termometro per gli operatori, pubblici e privati; Qualità: le principali criticalità rispetto alla qualità dei dati riguarda: questioni di definizione sistemi di classificazione utilizzati validazione dei dati; Copertura informativa: anche se garantiscono una copertura, di solito, sulla intera popolazione oggetto di studio, vengono rilevate solo le variabili pertinenti lattività gestionale dellagenzia. La sfida, è quella di recepire nel disegno della raccolta dei dati le esigenze principali degli altri operatori; Timeliness (tempestività): i dati amministrativi sono in genere disponibili troppo lentamente perché possano essere usati direttamente per produrre statistiche di breve termine, vale a dire come termometro per gli operatori, pubblici e privati; Qualità: le principali criticalità rispetto alla qualità dei dati riguarda: questioni di definizione sistemi di classificazione utilizzati validazione dei dati; Copertura informativa: anche se garantiscono una copertura, di solito, sulla intera popolazione oggetto di studio, vengono rilevate solo le variabili pertinenti lattività gestionale dellagenzia. La sfida, è quella di recepire nel disegno della raccolta dei dati le esigenze principali degli altri operatori;

8 Sfide, per gli utilizzatori di dati amministrativi La principale sfida cui si trovano di fronte gli utilizzatori di dati amministrativi è quella di sviluppare un know how analogo a quello a disposizione nelluso dei dati survey. Le principali criticalità: [ luso di dati amministrativi. definizione e sfide ] [ 6 / 6 ] Problemi di selezione: in una survey la rappresentatività dei dati è garantita dal disegno della rilevazione, e dalle metodologie per svolgere la rilevazione stessa. Su entrambi i punti cè una amplissima letteratura scientifica, ed esistono standard e metodologie ampiamente condivise. Mappatura delle informazioni: essendoci una diversità tra linformazione raccolta (ad esempio: la retribuzione base per il calcolo dei contributi) e linformazione di interesse per lo studioso (ad esempio: la retribuzione lorda, o costo del lavoro), la prima va mappata nella seconda. Conversione delle codifiche: una mappatura analoga, anche a parità di variabile osservata, è necessaria tra le codifiche utilizzate nella raccolta, e le codifiche standard utilizzate nella letteratura scientifica Problemi di selezione: in una survey la rappresentatività dei dati è garantita dal disegno della rilevazione, e dalle metodologie per svolgere la rilevazione stessa. Su entrambi i punti cè una amplissima letteratura scientifica, ed esistono standard e metodologie ampiamente condivise. Mappatura delle informazioni: essendoci una diversità tra linformazione raccolta (ad esempio: la retribuzione base per il calcolo dei contributi) e linformazione di interesse per lo studioso (ad esempio: la retribuzione lorda, o costo del lavoro), la prima va mappata nella seconda. Conversione delle codifiche: una mappatura analoga, anche a parità di variabile osservata, è necessaria tra le codifiche utilizzate nella raccolta, e le codifiche standard utilizzate nella letteratura scientifica

9 microdati che registrano tutti i principali eventi delle storie lavorative individuali microdati che registrano tutti i principali eventi delle storie lavorative individuali [ cosè WHIP ] WHIP sta per Work Histories Italian Panel lavoro autonomo pensione lavoro dipendente disoccupazione [ 1 / 6 ]

10 WHIP è basato principalmente su dati amministrativi forniti dallINPS al Laboratorio Revelli in base a una convenzione tra listituto previdenziale e lUniversità di Torino. Unaltra fonte importante per Whip sono i dati amministrativi forniti dallINAIL, in base a una convenzione analoga, relativi agli infortuni sul lavoro e alle malattie professionali. Il campionamento è sistematico, in base a quattro date di nascita. Ne risulta un campione di circa 1:90 individui (4/365), seguiti con grande dettaglio a partire dal 1985, e con minor dettaglio per gli anni precedenti (dato riassuntivo degli Estratti Conto). Fonte dei dati e copertura campionaria [ cosè WHIP ] [ 2 / 6 ]

11 [ cosè WHIP ] struttura della banca dati individui imprese lavoro dipendente serie dipendenti pensioni lavoro autonomo prestazioni sociali anagrafiche episodi dati annuali infortuni / MP dati annui RL [ 3 / 6 ]

12 Dinamiche di impresa Come si colloca nel mercato delle banche dati statistiche Retribuzioni Occupazione e mobilità [ cosè WHIP ] [ 4 / 6 ]

13 I principali competitori Rilevazione Trimestrale delle forze di lavoro (Istat) Indagine sui bilanci delle famiglie italiane (Banca dItalia) Indagine sulloccupazione, gli orari di lavoro e le retribuzioni presso le grandi imprese dellindustria e dei servizi (Istat) Indagine sulle retribuzioni e orari contrattuali (Istat)...banche dati varie sulle imprese... [ cosè WHIP. I competitori ] [ 5 / 6 ]

14 [ cosè WHIP. la danza dei sette veli… ] [ 6 / 6 ]

15 [ cosè WHIP. la danza dei sette veli… ] [ 6 / 6 ]

16 [ cosè WHIP. la danza dei sette veli… ] [ 6 / 6 ]

17 [ cosè WHIP. la danza dei sette veli… ] [ 6 / 6 ]

18 [ cosè WHIP. la danza dei sette veli… ] [ 6 / 6 ]

19 [ cosè WHIP. la danza dei sette veli… ] [ 6 / 6 ]

20 Rilevazione Trimestrale delle Forze di Lavoro Periodicità Trimestrale Copertura Costituisce la principale fonte statistica sul mercato del lavoro in Italia. Da essa vengono derivate le stime ufficiali a livello aggregato degli occupati e delle persone in cerca di lavoro. Luniverso di riferimento dellindagine è costituito da tutti i componenti delle famiglie residenti in Italia, anche se temporaneamente emigrati allestero. Sono esclusi i membri permanenti delle convivenze (collegi, convitti, conventi, caserme, ecc.). L'unità di rilevazione è la famiglia di fatto. Questa va intesa come un insieme di persone legate da vincoli di matrimonio, parentela, affinità, adozione, tutela o da vincoli affettivi, coabitanti ed aventi dimora abituale nello stesso comune (anche se non residenti secondo lanagrafe nello stesso domicilio). L'indagine viene svolta trimestralmente a gennaio, aprile, luglio e ottobre di ogni anno al fine di cogliere la stagionalità dei fenomeni rilevati. (estratto da [ cosè WHIP. schede ]

21 Indagine sui bilanci delle famiglie italiane Periodicità Biennale Copertura L'indagine sui bilanci delle famiglie italiane nasce negli anni '60 con l'obiettivo di raccogliere informazioni sui redditi e i risparmi delle famiglie italiane. Nel corso degli anni l'oggetto della rilevazione si è andato estendendo includendo anche la ricchezza e altri aspetti inerenti i comportamenti economici e finanziari delle famiglie, come ad esempio l'uso dei mezzi di pagamento. Nelle ultime indagini il campione è formato da circa famiglie ( individui), distribuite in circa 300 comuni italiani. I risultati dell'indagine vengono regolarmente pubblicati nei Supplementi al Bollettino Statistico della Banca. I dati raccolti presso le famiglie, in forma anonima, sono disponibili gratuitamente per elaborazioni e ricerche. [ cosè WHIP. schede ]

22 Indagine sull'occupazione, gli orari di lavoro e le retribuzioni presso le grandi imprese dell'industria e dei servizi Periodicità Mensile Copertura I dati vengono diffusi sotto forma di indici (dicembre 2000=100) delle retribuzioni orarie e per dipendente. Essi vengono ricavati dallindagine sulle imprese con 500 e più addetti del settore industriale (estrazione minerali, attività manufatturiere, energia, gas e acqua e costruzioni) e di quello dei servizi (commercio, alberghi e attività pubbliche, trasporti e comunicazioni, servizi di produzione). Lindice delle retribuzioni lorde per dipendente viene calcolato per le seguenti tre categorie: operai e apprendisti, impiegati e intermedi e totale dei lavoratori (esclusi i dirigenti). La retribuzione lorda considerata comprende tutti i pagamenti, regolari e irregolari, comprensivi dei contributi previdenziali, delle tasse e della liquidazione e al netto dei pagamenti fatti per conto di enti di previdenza sociale. (estratto da [ cosè WHIP. schede ]

23 Indagine sulle retribuzioni e orari contrattuali Periodicità Mensile Copertura I dati vengono diffusi sotto forma di indici (dicembre 2000=100) delle retribuzioni orarie e per dipendente. Essi vengono definiti sulla base dei più rappresentativi contratti collettivi nazionali di lavoro e, per i soli settori dellagricoltura e delle costruzioni, anche utilizzando contratti provinciali. I numeri indice delle retribuzioni contrattuali per dipendente forniscono una misura delle variazioni dei compensi che spetterebbero, nellarco di un anno, al lavoratore dipendente sulla base dei contenuti dei contratti nazionali di lavoro e della normativa in vigore. La retribuzione viene espressa in forma mensilizzata, cioè calcolata come dodicesimo della retribuzione spettante, nellarco di un anno. Gli indici delle retribuzioni contrattuali prendono a riferimento i rapporti di lavoro dipendente a tempo pieno, senza considerare alcuna detrazione per eventuali periodi di assenza, né altre motivazioni che giustifichino una riduzione dei compensi previsti contrattualmente. (estratto da [ cosè WHIP. schede ]

24 [ What is WHIP ]. the source data ( 1 / 2 ) lofferta di dati è consistente: about individuals observed; around million observations (records per variables) the coverage is wide: INPS administrates pensions and social security benefits of all italian workers but those employed in the public sector, and some categories of professionals working as self-employed. no survey-like attrition: no individuals lost due to missing records......but: if an individual go black, nothing is recorded certified information: high average quality of the information recorded the information is collected for administrative purposes, not for research ones lofferta di dati è consistente: about individuals observed; around million observations (records per variables) the coverage is wide: INPS administrates pensions and social security benefits of all italian workers but those employed in the public sector, and some categories of professionals working as self-employed. no survey-like attrition: no individuals lost due to missing records......but: if an individual go black, nothing is recorded certified information: high average quality of the information recorded the information is collected for administrative purposes, not for research ones …alcuni pro e contro…

25 [ What is WHIP ]. the source data ( 2 / 2 ) How long is the distance between INPS source data and a database designed for scientific purposes? data encoding is tipically different: a scientist looks at international classifications, INPS staff has to refer to the classifications contained in protocols and rules data normalization: the categories in which the informations is organized are tipically different no purpose, no quality: when a not-strictly-needed (for INPS) information is recorded, its quality can be very low; but we need quality standards to be met for all information contained in the database extremely important (for research issues) information is not recorded: job start - job end actually, the job itself a time-invariant firm id the education level, the family status, … data encoding is tipically different: a scientist looks at international classifications, INPS staff has to refer to the classifications contained in protocols and rules data normalization: the categories in which the informations is organized are tipically different no purpose, no quality: when a not-strictly-needed (for INPS) information is recorded, its quality can be very low; but we need quality standards to be met for all information contained in the database extremely important (for research issues) information is not recorded: job start - job end actually, the job itself a time-invariant firm id the education level, the family status, …

26 data receptiondocs collection data cleansing data normalization Inps archives sample docs longitudinal identification of firms longitudinal identification of job spells the factory work histories database on line documentation Inputs Outputs [ What is WHIP ]. the Whip building procedure ( 1 / 3 )

27 snaphot on the multi-to-multi relation between contributive records and jobs [ What is WHIP ]. the Whip building procedure ( 2 / 3 ) year #records multiple records within job ,7% ,2% ,9% ,1% ,9% ,4% ,5% ,0% ,8% ,2% ,3% ,7% ,0% ,9% ,0%

28 [ What is WHIP ]. the Whip building procedure ( 3 / 3 ) snaphot on the impact of the longitudinal identification of firms (LIF) on job histories snaphot on the impact of the longitudinal identification of firms (LIF) on job histories

29 WHIP structure individuals firms job spells firms yearly data jobs yearly data pensions self employment s.s. benefits registers episodes yearly data [ What is WHIP ]. here it is

30 [ documentation and distribution policy ] WHIPs datahouse: WHIPs datahouse:

31 Future prospects [ future prospects ] ( 1 / 2 ) next releases: extension of the period covered to pre-1985 work history, to 2003, plus linkage to ISEE records; sample extension: the replica of WHIP as is with an upgrade from 4/365 to 24/365 would grant a representativeness to the province level WHIP building procedure extension: there are many directions in which the building procedure can be improved. Firms tranformations identification, labour cost measure, eligibility imputation, … integration: possible fruitful linkages with INAIL (under construction), CPI, INPDAP… microsimulations: the availability of large, administrative based datasets can/should be the gateway to a wider use of microsimulations as a knowledge support for the policy maker next releases: extension of the period covered to pre-1985 work history, to 2003, plus linkage to ISEE records; sample extension: the replica of WHIP as is with an upgrade from 4/365 to 24/365 would grant a representativeness to the province level WHIP building procedure extension: there are many directions in which the building procedure can be improved. Firms tranformations identification, labour cost measure, eligibility imputation, … integration: possible fruitful linkages with INAIL (under construction), CPI, INPDAP… microsimulations: the availability of large, administrative based datasets can/should be the gateway to a wider use of microsimulations as a knowledge support for the policy maker


Scaricare ppt "WHIP Work Histories Italian Panel WHIP Work Histories Italian Panel roberto leombruni Laboratorio Revelli e Università di Torino roberto leombruni Laboratorio."

Presentazioni simili


Annunci Google