1 Fertility and Family Survey Standard Recode Files.

Slides:



Advertisements
Presentazioni simili
L’Organizzazione per la cooperazione e lo sviluppo economico
Advertisements

Monitoraggio e valutazione dei servizi formativi
Consiglio dei ministri dell’U.E. Commissione Europea
La storia dell’Europa.
Esempio di data set su foglio elettronico.
DBMS (DataBase Management System)
Dottorato in Società dellInformazione Università degli Studi di Milano-Bicocca Una rete per la scuola in ospedale Andrea Marcante.
La chiusura del dataset 2008: scadenze e procedure Gianluigi Ferrante - Valentina Minardi 6 Febbraio 2009 Istituto Superiore di Sanità
Unione Europea.
Unione Europea.
Ricerca non sperimentale: La ricerca survey (inchiesta)
TW Analisi dei documenti n Classificazione dei componenti n Selezione dei componenti, costruzione della gerarchia, dei blocchi informativi e degli elementi.
Parte Ia LUnione europea. Cosè? Una struttura sovranazionale costituita da varie istituzioni che interagiscono tra loro Una sorta di proto-stato europeo.
Questionario Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°2.
Percorso: la progettazione e implementazione del questionario
Percorso: la rappresentazione dei dati
Innovazione nelle indagini statistiche sui trasporti
Adesione Attività Promozionali FIPAV. Introduzione Gli istituti scolastici di scuola primaria possono aderire alle attività promozionali della FIPAV così
I questionari di rilevazione: le principali caratteristiche 15° Censimento generale della popolazione e delle abitazioni Giornate formative per gli UPC.
Bologna, gg/mese/anno Esempio di: Presentazione dellesercizio sugli indicatori Il candidato deve inserire qui le proprie generalità Nome ………………. Cognome.
La matrice dei dati E’ possibile organizzare i dati in forma di matrice se: l’unità di analisi è unica (ad esempio non si possono includere individui e.
Come scrivere una relazione di fisica.
Access: Query semplici
Le domande del questionario
Modello E-R Generalizzazioni
Linternazionalizzazione delle imprese italiane nellEuropa dellEst Università degli studi dellInsubria.
Procedure Decisionali La parte del processo di formazione di una politica con la quale le istituzioni che svolgono la funzione legislativa approvano formalmente.
Il Decreto legislativo n. 59 del 2004 (Riforma) indica i livelli scolastici interessati (inizio I, II e III biennio). Il periodo di somministrazione è
ACCESS Introduzione Una delle necessità più importanti in informatica è la gestione di grandi quantità di dati. I dati possono essere memorizzati.
Come codificare un questionario
Pensare a una classe con Bisogni Educativi Speciali
Modulo 5 DataBase ACCESS. Informazioni e Dati INFORMAZIONI vengono scambiate con linguaggio scritto o parlato DATI rappresentazione di informazioni in.
Agenzia per l’Italia Digitale Gestione ex-DigitPA Diritto di iniziativa dei cittadini europei.
ATTRAVERSO IL MERCATO UNICO EUROPEO: SISTEMA DI COOPERAZIONE TRA I PAESI MEMBRI - PER ESSERE COMPETITIVI SUL MERCATO MONDIALE -PER RIDURRE LE.
I DBMS BASI DI DATI (DATABASE) Insieme organizzato di dati utilizzati
Lettura e analisi statistiche dei dati e computer analysis
Variabili temporali Analisi statistica
La statistica.
ATTIVITA’ FISICA, SALUTE E ANZIANI Paola Ciddio CeBiSM Centro Interuniversitario di Bioingegneria e Scienze Motorie Psicologia del Lavoro e delle Organizzazioni.
La pianificazione della produzione dei dati. Costituzione del gruppo di progettazione L’elevato grado di complessità e la multidisciplinarietà richiesta.
 INVALSI   Sviluppato da: Organizzazione per la Cooperazione e lo Sviluppo Economico (OECD – OCDE – OCSE)  PISA-Programme for International.
La valutazione Slide del Titolo Carattere Optima passo 32 - Centrato.
1 Laboratorio di Introduzione alla Programmazione §II MODULO §3 crediti §Esame e voto unico (su 6 crediti totali)
1 Laboratorio di Introduzione alla Programmazione §II MODULO §3 crediti §Esame e voto unico (su 6 crediti totali)
Le norme ISO 9000 ed il Manuale della Qualità
GUIDA ALL’UTILIZZO DEL
Statistiche sul turismo a confronto La rilevazione vs i dati di statistica ufficiale sul turismo Roberta Panaccione Viterbo, 24 ottobre 2014.
Manuale Utente – i-Sisen Questionario dei Consumi
Inserire le modalità di recupero nel registro elettronico
PROGRAMMA EUROPA PER I CITTADINI
Cloud Tecno V. Percorso didattico per l’apprendimento di Microsoft Access 4 - Le maschere.
LABORATORIO DI DOCIMOLOGIA E VALUTAZIONE DELL’APPRENDIMENTO PERMANENTE CORSO DI LAUREA FSRU Prof. Cinzia Angelini Università Roma Tre Anno accademico
MAGIC 5 Gruppo LECCE R. Cataldo M.Quarta G. De Nunzio LECCE MAGGIO 2005 R.Cataldo M.Quarta G.De Nunzio Organizzazione della struttura del DB delle immagini.
Incontro informativo per gli studenti idonei alla mobilità Erasmus nell’a.a.2016/2017.
GLI SCAMBI INTRACOMUNITARI IL SISTEMA INTRASTAT. I MODELLI INTRASTAT Frontespizio Unico Beni e Servizi Intra1 (Cessioni di Beni e Servizi Resi) Intra2.
Diritto di Iniziativa dei Cittadini Europei (ICE).
Verso un’anagrafe degli studenti in FVG Primo incontro di accompagnamento Trieste, 14 settembre 2006.
WebDewey Italiana di Piero Cavaleri.
Interazione Persona Computer prova di progetto Gruppo: IO Componenti: Carlo Solimando Sito analizzato:
Access Breve introduzione. Componenti E’ possibile utilizzare Access per gestire tutte le informazioni in un unico file. In un file di database di Access.
Modulo 5 – Database ACCESS LICEO SCIENTIFICO “ B. RESCIGNO COMPUTER SCUOLA PIANO INTEGRATO 2008/09 ESPERTO prof.ssa Rita Montella.
L’ITALIA IN EUROPA: dati economici a confronto L’ITALIA IN EUROPA: dati economici a confronto A cura della Direzione Affari Economici e Centro Studi.
10 ottobre 2011 L'Italia al CERN LE PROCEDURE D’ACQUISTO DEL CERN Dante Gregorio.
Linguaggio SQL. Linguaggi per database La diffusione del modello relazionale ha favorito l’uso prevalente di linguaggi non procedurali: in questo modo.
8 FORZE DI LAVORO, OCCUPAZIONE E DISOCCUPAZIONE L’argomento: misurazione delle variabili macroeconomiche Oggi parleremo di: indicatori del mercato aggregato.
Progetta il tuo stage in Europa Euroguidance Italy.
03/06/20161 SPSS Statistics Statistical Package for Social Science.
POST ENUMERATION SURVEY IL SISTEMA DI GESTIONE DELLA RILEVAZIONE Maura Giacummo DIQR – DCIT – RST/1. Giulia Vaste DIQR – DCIT – RST/1.
ROMA 23 GIUGNO 2016 AREA TEMATICA 1. PROSPETTIVE DEI SISTEMI STATISTICI Validation: un approccio metodologico comune per la validazione dei dati e l’automazione.
Transcript della presentazione:

1 Fertility and Family Survey Standard Recode Files

2 L’indagine Il Questionario I Dati descrizione di files di dati in formato ASCII Confrontabilità dei dati le variabili le strategie campionarie Esempi di utilizzo dei files: controllo di qualità dei dati Casi particolari

3 L’Indagine Coordinata dalla Population Activity Unit - UNECE Ha coinvolto 23 paesi a sviluppo avanzato donne uomini Fra Ottobre 1988 e Dicembre 1997 sono stati intervistati: di età compresa fra 15 e 59 anni + GRECIA

4 L’Indagine

5 Il Questionario Per facilitare la confrontabilità dei dati è stato deciso di adottare un questionario unico (standard questionnaire) Ciascun paese è stato libero di applicarlo nel modo giudicato più appropriato, purché si potesse riuscire a delineare un set di risposte standard. Questo ha, di fatto, inficiato la confrontabilità dei dati. Il questionario ha una struttura complessa anche perché raccoglie dati sugli eventi relativi a quattro differenti storie: unioni, fecondità, istruzione, attività lavorativa.

6 Il Questionario Il questionario standard si compone di due tipi di sezioni: CORE SECTIONS (10): OPTIONAL MODULES (4): Sono le sezioni fondamentali che tutti i Paesi hanno dovuto implementare. Comprendono i dati sulle storie di vita. Comprendono le variabili la cui confrontabilità internazionale è ritenuta non necessaria o difficilmente ottenibile. E’ stato utilizzato lo stesso questionario per uomini e donne. Lo si può scaricare (in formato PDF) dal sito:

7 Section 0 household characteristics Section 1 parental home Section 2 partnerships Il Questionario Module 1 migration history partnerships table solo chi ha avuto almeno un partner

8 Section 3 children Section 4 other pregnancies Section 5 fertility regulation Il Questionario maternity table Module 2 contraception history solo chi ha avuto almeno un figlio solo le donne per le gravidanze precedenti; anche gli uomini per quella attuale della partner

9 Section 6 views on having children Section 7 other views Section 8 education occupation Section 9 partner characteristics Il Questionario Module 3 values and beliefs Module 4 population policy acceptance occupational history educational history solo chi ha frequentato la scuola dopo i 15 anni solo chi ha avuto almeno un lavoro

10 I Dati Ogni Paese coinvolto nel progetto ha predisposto una versione nazionale del questionario standard internazionale seguendo le direttive generali. La base di dati consiste in un file formato ASCII per ciascun paese e di un programma di lettura dei dati in SPSS.

11 I Dati Per ogni rispondente (caso) esistono molti record logici. Il numero dei record logici è variabile a seconda di quanti eventi sono stati sperimentati. Ad esempio: una donna può aver avuto 5 figli e 3 lavori differenti. Deve esistere un record per ognuno di essi. Esistono fino a 23 tipi di records logici E ognuno può avere una lunghezza differente.

12 I Dati Si possono distinguere records logici di tipo: Singolo Multiplo se è previsto che il record non si ripeta se il record con la sua struttura si ripete per ogni evento della storia di vita o per ogni membro della famiglia. Ad esempio, sono di tipo singolo tutti i record che richiedono opinioni

13 I Dati Codice del record S=singolo M=multiplo core / module sezione

14 I Dati Per rendere utilizzabili i dati dai più comuni pacchetti statistici, è stato necessario ‘rettangolarizzare’ i files, cioè modificarli in modo tale da avere lo stesso numero di records logici per ogni individuo, indipendentemente dal numero di eventi sperimentati in ciascuna carriera. La strategia seguita è la più semplice, anche se non la più efficiente: per ogni individuo è stato predisposto un numero fisso di records logici relativi alle storie di vita, prendendo in considerazione il numero massimo di eventi registrati nei campioni. Ad esempio per una donna che abbia avuto due figli saranno inseriti solo i dati relativi ai primi due record e i rimanenti saranno lasciati blank.

15 I Dati Descrizione dei files di dati in formato ASCII:  Numero fisso di records per ogni individuo  Le prime 14 colonne sono sempre occupate da codice identificativo del paese (colonne 1-2) codice identificativo della famiglia (colonne 3-12) numero del record (colonne 13-14) 102 per Austria, Belgio, Norvegia, Canada, Finlandia, Polonia, Germania, Svezia, Ungheria, Francia, Lituania, Lettonia, Italia 110 per la Spagna 146 per Slovenia, Nuova Zelanda, Portogallo, Repubblica Ceca, Bulgaria 1 per gli Stati Uniti (ha una codifica differente dagli altri SRF)

Esempio: dati relativi ad un individuo codice identificativo del paese (08=Germania) codice identificativo della famiglia numero del record Record di tipo 01: Informazioni sui membri della famiglia (2 componenti) I Dati

17 I Dati Tutte le variabili iniziano con la lettera ‘V’ tranne: Le variabili di tipo IND.. che indicano il numero d’ordine del record multiplo Le variabili di tipo IMP.. che indicano se c’è stato o meno inserimento manuale delle date incerte per quanto riguarda le storie Le variabili del primo record (record 00) Ad esempio: IND01 indica il numero d’ordine del componente della famiglia nei record 01 Ad esempio:IMP21 indica se c’è stato inserimento manuale (=1) o meno (=2) per quanto riguarda le date relative alle partnerships (COUNTRY, MONTH, YEAR,…)

18 I Dati i componenti della famiglia (record di tipo 01), la storia delle unioni (record di tipo 21), la storia della maternità (record di tipo 31), la storia dell’istruzione (record di tipo 81), la storia delle attività lavorative (record di tipo 82), le variabili relative ad ogni componente o ad ogni storia, sono identificate con un suffisso a due cifre che ne indica il numero d’ordine. Per quanto riguarda : Esempio: mese di inizio del terzo lavoroV823M$03 anno di inizio del terzo lavoroV823Y$03 orario settimanale medio del terzo lavoroV828$03

19 Confrontabilità Anche se l’indagine è stata concepita in modo tale da risultare perfettamente comparativa, numerose sono state le modifiche che ogni Paese ha apportato al questionario standard. Questo è accaduto anche perché le modalità di risposta previste a livello centrale non potevano cogliere le particolarità a livello nazionale. Esempio 1) Titolo di studioOgni paese ha un proprio caratteristico sistema scolastico. Ogni paese ha avuto cura di ricodificare le modalità di risposta locale secondo la classificazione ISCED. Esempio 2) Tipologia dell’attività lavorativa Le modalità di risposta standard seguivano la classificazione ISCO. Per l’Italia è stato impossibile effettuare la ricodifica in ISCO. Le variabili

20 Confrontabilità Ogni paese è stato libero di scegliere quante e quali variabili includere nel questionario nazionale. Per questo motivo alcune sezioni possono essere state implementate interamente o solo parzialmente, a seconda che le domande standard siano state incluse (anche modificandole) in tutto in in parte. Inoltre ogni paese nel passaggio dal questionario standard a quello nazionale ha potuto modificare le domande in vari modi, pregiudicando in qualche caso la confrontabilità internazionale, tanto da non potere inserire l’informazione nel file di dati standard (SRF).

21 Confrontabilità Senza pretesa di esaustività si possono distinguere le seguenti modificazioni: - una domanda può essere stata modificata, ad esempio può essere stato modificato il periodo di riferimento della domanda. In questo caso non vengono intraprese azioni correttive perché basta specificare la differenza in una nota. Ad esempio per l’uso attuale di un metodo contraccettivo (domanda V514) il periodo di riferimento può essere stato modificato da 4 a 2 settimane. - una domanda può essere stata cancellata: in questo caso al campo dello SRF relativo alla domanda viene assegnato il codice ‘not implemented’.

22 Confrontabilità - una domanda che non è presente nel questionario standard è stata inserita in quello nazionale: in questo caso l’informazione non viene aggiunta allo SRF. - lo schema di codifica delle modalità di risposta ad una domanda standard chiusa viene alterato: in questo caso si cerca di ricodificare le risposte in modo tale da ricondurre lo schema a quello standard; se ciò non è possibile la domanda viene considerata ‘not implemented’. - viene modificato l’ordine dei ‘filtri’ esistenti nel questionario standard: questo può accadere in vari modi e le possibilità di correzione devono essere valutate caso per caso.

23 Confrontabilità Variabili o sezioni ‘not implemented’ Tutte le variabili che erano previste dal questionario standard ma che a livello nazionale non sono state inserite (sia perché la domanda non è stata posta affatto sia perché è stata posta in modo tale da inficiare la confrontabilità) vengono considerate ‘not implemented’. Se una intera sezione non viene inclusa allora i record di quella sezione spariscono dallo SRF. Se solo alcune variabili non vengono inserite si troveranno i codici 9 per le variabili le cui modalità di risposta hanno 1 cifra 99 per le variabili le cui modalità di risposta hanno 2 cifre Codifica

24 Confrontabilità La PAU-UNECE ha predisposto sul sito INTERNET una serie di tabelle che possono aiutare per accertare la presenza e la confrontabilità dei dati. Per la ‘copertura’ dei questionari nazionali rispetto allo standard Per la presenza e confrontabilità delle singole variabili: E’ importante consultare i questionari nazionali predisposti in lingua inglese per valutare le modificazioni apportate alle variabili.

25 variabili dello SRFriferimento al questionario nazionalelo ‘0’ indica che la variabile è ‘not implemented’ cioè non presente sullo SRF un * indica che ci sono state modifiche fra la variabile nazionale e quella standard

26 Confrontabilità Le strategie campionarie Il piano dell’indagine prevede di intervistare per ogni paese: Almeno 5000 rispondenti, di cui almeno 3000 femmine e 2000 maschi Proporzionalmente distribuiti almeno nell’intervallo di età 20-39* Proporzionalmente distribuiti per stato civile Proporzionalmente distribuiti sul territorio, indipendentemente dalla nazionalità * ma la Svezia, ad esempio, ha intervistato solo alcune generazioni

27 Confrontabilità L’unità elementare è l’individuo. L’unità di rilevazione cambia al variare del piano di campionamento adottato e può essere l’individuo o la famiglia. Il periodo di svolgimento dell’indagine non è unico per tutti i paesi e copre l’arco di quasi 10 anni.di quasi 10 anni Alcuni paesi hanno utilizzato dei pesi per riproporzionare il campione (variabile WEIGHT). Se non è previsto l’utilizzo dei pesi la variabile WEIGHT vale 1 per tutti gli individui

28 Confrontabilità E’ importante consultare gli Standard Country Report (SCR) dei singoli paesi per avere informazioni sul piano di campionamento adottato e su altre particolarità di tipo tecnico. Ad esempio in Ungheria il piano di campionamento prevede l’inserimento nel campione di tutti i membri di una famiglia, purché l’età sia compatibile con quella prevista. Questo porta ad avere lo stesso codice identificativo della famiglia per i diversi componenti e può creare problemi in fase di elaborazione.

29 Esempi di utilizzo dei files Il controllo di qualità dei dati E’ ovviamente il primo passo da fare quando si utilizzano i dati. Può essere utile creare delle tabelle doppie per verificare l’esistenza di dati mancanti (non di sistema). Codifiche: Dati mancanti (‘Non rispondo’): 8 o 98 rispettivamente per le modalità di risposta a una o due cifre ‘Non so’ 7 o 97 rispettivamente per le modalità di risposta a una o due cifre

30 Esempi di utilizzo dei files Il programma SPSS di lettura dei files ricodifica automaticamente i valori ‘8’ e ‘98’ a missing. Potrebbe essere utile invece eliminare all’inizio questa parte per tenere distinti i missing di sistema dai missing reali e facilitare così il controllo di qualità dei dati. Nella diapositiva successiva viene presentato un esempio relativo al controllo di qualità dei dati mediante tabelle doppie (linguaggio SAS)

31 Esempi di utilizzo dei files Total number of partnerships Cumulative V215 Frequency Frequency Es. Germania 3118 persone non hanno avuto alcuna unione

32 Esempi di utilizzo dei files Es. Germania TABLE OF IND21_01 (Index number partnership) BY V215 (Total number of partnerships) Frequency| 0| 1| | 5| 6| Total … | 3118 | 0 | | 0 | 0 | … | 0 | 5507 | | 8 | 4 | … Total ed effettivamente troviamo 3118 individui che hanno il valore ‘.’ per la variabile ‘numero d’ordine della partnership’ Total number of partnerships Index number of partnership

33 Esempi di utilizzo dei files Es. Germania TABLE OF V218M_01 (Month start living together) BY IND21_01 (Index number partnership) Frequency|.| 1| Total | 3118 | 0 | | 0 | 434 | | 0 | 409 | | 0 | 472 | | 0 | 496 | | 0 | 731 | … … | 0 | 334 | | 0 | 345 | | 0 | 667 | Total Index number of partnership Month start living together 667 persone fra quelle che hanno avuto almeno 1 unione dovevano rispondere sul mese di inizio, ma non l’hanno fatto.

34 Casi particolari USA: è stato predisposto un file in cui ogni riga è un individuo. Oltre ai dati e al programma di lettura in SPSS è anche presente il CODEBOOK ed un file informativo generale (README) sia in versione testo sia in versione per Word. Sono risultate incoerenti: La storia lavorativa degli intervistati per la Germania La storia dell’istruzione per l’Austria Sono disponibili i testi delle scambiate con i rappresentanti nazionali per avere delucidazioni su alcune variabili. Sono state richieste anche informazioni sui sistemi scolastici (Lituania e Lettonia) Ad esempio non hanno utilizzato la classificazione ISCED per l’istruzione

35 Casi particolari Per quanto riguarda l’Italia è possibile recuperare alcune variabili che non sono state incluse nello SRF, avendo cura di utilizzare l’opportuno codice identificativo della famiglia Esso si trova nelle colonne 3-6 dello SRF