La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

1 Fertility and Family Survey Standard Recode Files.

Presentazioni simili


Presentazione sul tema: "1 Fertility and Family Survey Standard Recode Files."— Transcript della presentazione:

1 1 Fertility and Family Survey Standard Recode Files

2 2 L’indagine Il Questionario I Dati descrizione di files di dati in formato ASCII Confrontabilità dei dati le variabili le strategie campionarie Esempi di utilizzo dei files: controllo di qualità dei dati Casi particolari

3 3 L’Indagine Coordinata dalla Population Activity Unit - UNECE Ha coinvolto 23 paesi a sviluppo avanzato 100.700 donne 47.800 uomini Fra Ottobre 1988 e Dicembre 1997 sono stati intervistati: di età compresa fra 15 e 59 anni + GRECIA

4 4 L’Indagine

5 5 Il Questionario Per facilitare la confrontabilità dei dati è stato deciso di adottare un questionario unico (standard questionnaire) Ciascun paese è stato libero di applicarlo nel modo giudicato più appropriato, purché si potesse riuscire a delineare un set di risposte standard. Questo ha, di fatto, inficiato la confrontabilità dei dati. Il questionario ha una struttura complessa anche perché raccoglie dati sugli eventi relativi a quattro differenti storie: unioni, fecondità, istruzione, attività lavorativa.

6 6 Il Questionario Il questionario standard si compone di due tipi di sezioni: CORE SECTIONS (10): OPTIONAL MODULES (4): Sono le sezioni fondamentali che tutti i Paesi hanno dovuto implementare. Comprendono i dati sulle storie di vita. Comprendono le variabili la cui confrontabilità internazionale è ritenuta non necessaria o difficilmente ottenibile. E’ stato utilizzato lo stesso questionario per uomini e donne. Lo si può scaricare (in formato PDF) dal sito: http://www.unece.org/deap/pau/ffs/ffsfem.pdf

7 7 Section 0 household characteristics Section 1 parental home Section 2 partnerships Il Questionario Module 1 migration history partnerships table solo chi ha avuto almeno un partner

8 8 Section 3 children Section 4 other pregnancies Section 5 fertility regulation Il Questionario maternity table Module 2 contraception history solo chi ha avuto almeno un figlio solo le donne per le gravidanze precedenti; anche gli uomini per quella attuale della partner

9 9 Section 6 views on having children Section 7 other views Section 8 education occupation Section 9 partner characteristics Il Questionario Module 3 values and beliefs Module 4 population policy acceptance occupational history educational history solo chi ha frequentato la scuola dopo i 15 anni solo chi ha avuto almeno un lavoro

10 10 I Dati Ogni Paese coinvolto nel progetto ha predisposto una versione nazionale del questionario standard internazionale seguendo le direttive generali. La base di dati consiste in un file formato ASCII per ciascun paese e di un programma di lettura dei dati in SPSS.

11 11 I Dati Per ogni rispondente (caso) esistono molti record logici. Il numero dei record logici è variabile a seconda di quanti eventi sono stati sperimentati. Ad esempio: una donna può aver avuto 5 figli e 3 lavori differenti. Deve esistere un record per ognuno di essi. Esistono fino a 23 tipi di records logici E ognuno può avere una lunghezza differente.

12 12 I Dati Si possono distinguere records logici di tipo: Singolo Multiplo se è previsto che il record non si ripeta se il record con la sua struttura si ripete per ogni evento della storia di vita o per ogni membro della famiglia. Ad esempio, sono di tipo singolo tutti i record che richiedono opinioni

13 13 I Dati Codice del record S=singolo M=multiplo core / module sezione

14 14 I Dati Per rendere utilizzabili i dati dai più comuni pacchetti statistici, è stato necessario ‘rettangolarizzare’ i files, cioè modificarli in modo tale da avere lo stesso numero di records logici per ogni individuo, indipendentemente dal numero di eventi sperimentati in ciascuna carriera. La strategia seguita è la più semplice, anche se non la più efficiente: per ogni individuo è stato predisposto un numero fisso di records logici relativi alle storie di vita, prendendo in considerazione il numero massimo di eventi registrati nei campioni. Ad esempio per una donna che abbia avuto due figli saranno inseriti solo i dati relativi ai primi due record e i rimanenti saranno lasciati blank.

15 15 I Dati Descrizione dei files di dati in formato ASCII:  Numero fisso di records per ogni individuo  Le prime 14 colonne sono sempre occupate da codice identificativo del paese (colonne 1-2) codice identificativo della famiglia (colonne 3-12) numero del record (colonne 13-14) 102 per Austria, Belgio, Norvegia, Canada, Finlandia, Polonia, Germania, Svezia, Ungheria, Francia, Lituania, Lettonia, Italia 110 per la Spagna 146 per Slovenia, Nuova Zelanda, Portogallo, Repubblica Ceca, Bulgaria 1 per gli Stati Uniti (ha una codifica differente dagli altri SRF)

16 16 08000005766700 8 576674 7921.7601 2 08000005766701 1 13941 08000005766701 24121814 08000005766701 08000005766702 2 1989899 08000005766710 3 653412 1 77017....... 08000005766790 3 62 08000005766791211311112222399999992212223222332144444444444444 080000057667922441441818988298888888888888888881111111211191 1 3 71222222498 1 Esempio: dati relativi ad un individuo codice identificativo del paese (08=Germania) codice identificativo della famiglia numero del record Record di tipo 01: Informazioni sui membri della famiglia (2 componenti) I Dati

17 17 I Dati Tutte le variabili iniziano con la lettera ‘V’ tranne: Le variabili di tipo IND.. che indicano il numero d’ordine del record multiplo Le variabili di tipo IMP.. che indicano se c’è stato o meno inserimento manuale delle date incerte per quanto riguarda le storie Le variabili del primo record (record 00) Ad esempio: IND01 indica il numero d’ordine del componente della famiglia nei record 01 Ad esempio:IMP21 indica se c’è stato inserimento manuale (=1) o meno (=2) per quanto riguarda le date relative alle partnerships (COUNTRY, MONTH, YEAR,…)

18 18 I Dati i componenti della famiglia (record di tipo 01), la storia delle unioni (record di tipo 21), la storia della maternità (record di tipo 31), la storia dell’istruzione (record di tipo 81), la storia delle attività lavorative (record di tipo 82), le variabili relative ad ogni componente o ad ogni storia, sono identificate con un suffisso a due cifre che ne indica il numero d’ordine. Per quanto riguarda : Esempio: mese di inizio del terzo lavoroV823M$03 anno di inizio del terzo lavoroV823Y$03 orario settimanale medio del terzo lavoroV828$03

19 19 Confrontabilità Anche se l’indagine è stata concepita in modo tale da risultare perfettamente comparativa, numerose sono state le modifiche che ogni Paese ha apportato al questionario standard. Questo è accaduto anche perché le modalità di risposta previste a livello centrale non potevano cogliere le particolarità a livello nazionale. Esempio 1) Titolo di studioOgni paese ha un proprio caratteristico sistema scolastico. Ogni paese ha avuto cura di ricodificare le modalità di risposta locale secondo la classificazione ISCED. Esempio 2) Tipologia dell’attività lavorativa Le modalità di risposta standard seguivano la classificazione ISCO. Per l’Italia è stato impossibile effettuare la ricodifica in ISCO. Le variabili

20 20 Confrontabilità Ogni paese è stato libero di scegliere quante e quali variabili includere nel questionario nazionale. Per questo motivo alcune sezioni possono essere state implementate interamente o solo parzialmente, a seconda che le domande standard siano state incluse (anche modificandole) in tutto in in parte. Inoltre ogni paese nel passaggio dal questionario standard a quello nazionale ha potuto modificare le domande in vari modi, pregiudicando in qualche caso la confrontabilità internazionale, tanto da non potere inserire l’informazione nel file di dati standard (SRF).

21 21 Confrontabilità Senza pretesa di esaustività si possono distinguere le seguenti modificazioni: - una domanda può essere stata modificata, ad esempio può essere stato modificato il periodo di riferimento della domanda. In questo caso non vengono intraprese azioni correttive perché basta specificare la differenza in una nota. Ad esempio per l’uso attuale di un metodo contraccettivo (domanda V514) il periodo di riferimento può essere stato modificato da 4 a 2 settimane. - una domanda può essere stata cancellata: in questo caso al campo dello SRF relativo alla domanda viene assegnato il codice ‘not implemented’.

22 22 Confrontabilità - una domanda che non è presente nel questionario standard è stata inserita in quello nazionale: in questo caso l’informazione non viene aggiunta allo SRF. - lo schema di codifica delle modalità di risposta ad una domanda standard chiusa viene alterato: in questo caso si cerca di ricodificare le risposte in modo tale da ricondurre lo schema a quello standard; se ciò non è possibile la domanda viene considerata ‘not implemented’. - viene modificato l’ordine dei ‘filtri’ esistenti nel questionario standard: questo può accadere in vari modi e le possibilità di correzione devono essere valutate caso per caso.

23 23 Confrontabilità Variabili o sezioni ‘not implemented’ Tutte le variabili che erano previste dal questionario standard ma che a livello nazionale non sono state inserite (sia perché la domanda non è stata posta affatto sia perché è stata posta in modo tale da inficiare la confrontabilità) vengono considerate ‘not implemented’. Se una intera sezione non viene inclusa allora i record di quella sezione spariscono dallo SRF. Se solo alcune variabili non vengono inserite si troveranno i codici 9 per le variabili le cui modalità di risposta hanno 1 cifra 99 per le variabili le cui modalità di risposta hanno 2 cifre Codifica

24 24 Confrontabilità La PAU-UNECE ha predisposto sul sito INTERNET una serie di tabelle che possono aiutare per accertare la presenza e la confrontabilità dei dati. http://www.unece.org/deap/pau/ffs/implmnt.htm Per la ‘copertura’ dei questionari nazionali rispetto allo standard http://www.unece.org/deap/pau/ffs/f_h_131.htm Per la presenza e confrontabilità delle singole variabili: E’ importante consultare i questionari nazionali predisposti in lingua inglese per valutare le modificazioni apportate alle variabili.

25 25 variabili dello SRFriferimento al questionario nazionalelo ‘0’ indica che la variabile è ‘not implemented’ cioè non presente sullo SRF un * indica che ci sono state modifiche fra la variabile nazionale e quella standard

26 26 Confrontabilità Le strategie campionarie Il piano dell’indagine prevede di intervistare per ogni paese: Almeno 5000 rispondenti, di cui almeno 3000 femmine e 2000 maschi Proporzionalmente distribuiti almeno nell’intervallo di età 20-39* Proporzionalmente distribuiti per stato civile Proporzionalmente distribuiti sul territorio, indipendentemente dalla nazionalità * ma la Svezia, ad esempio, ha intervistato solo alcune generazioni

27 27 Confrontabilità L’unità elementare è l’individuo. L’unità di rilevazione cambia al variare del piano di campionamento adottato e può essere l’individuo o la famiglia. Il periodo di svolgimento dell’indagine non è unico per tutti i paesi e copre l’arco di quasi 10 anni.di quasi 10 anni Alcuni paesi hanno utilizzato dei pesi per riproporzionare il campione (variabile WEIGHT). Se non è previsto l’utilizzo dei pesi la variabile WEIGHT vale 1 per tutti gli individui

28 28 Confrontabilità E’ importante consultare gli Standard Country Report (SCR) dei singoli paesi per avere informazioni sul piano di campionamento adottato e su altre particolarità di tipo tecnico. Ad esempio in Ungheria il piano di campionamento prevede l’inserimento nel campione di tutti i membri di una famiglia, purché l’età sia compatibile con quella prevista. Questo porta ad avere lo stesso codice identificativo della famiglia per i diversi componenti e può creare problemi in fase di elaborazione.

29 29 Esempi di utilizzo dei files Il controllo di qualità dei dati E’ ovviamente il primo passo da fare quando si utilizzano i dati. Può essere utile creare delle tabelle doppie per verificare l’esistenza di dati mancanti (non di sistema). Codifiche: Dati mancanti (‘Non rispondo’): 8 o 98 rispettivamente per le modalità di risposta a una o due cifre ‘Non so’ 7 o 97 rispettivamente per le modalità di risposta a una o due cifre

30 30 Esempi di utilizzo dei files Il programma SPSS di lettura dei files ricodifica automaticamente i valori ‘8’ e ‘98’ a missing. Potrebbe essere utile invece eliminare all’inizio questa parte per tenere distinti i missing di sistema dai missing reali e facilitare così il controllo di qualità dei dati. Nella diapositiva successiva viene presentato un esempio relativo al controllo di qualità dei dati mediante tabelle doppie (linguaggio SAS)

31 31 Esempi di utilizzo dei files Total number of partnerships Cumulative V215 Frequency Frequency ---------------------------- 0 3118 3118 1 5507 8625 2 1070 9695 3 232 9927 4 73 10000 5 8 10008 6 4 10012 Es. Germania 3118 persone non hanno avuto alcuna unione

32 32 Esempi di utilizzo dei files Es. Germania TABLE OF IND21_01 (Index number partnership) BY V215 (Total number of partnerships) Frequency| 0| 1| | 5| 6| Total ---------+--------+--------+… +--------+--------+. | 3118 | 0 | | 0 | 0 | 3118 ---------+--------+--------+… +--------+--------+ 1 | 0 | 5507 | | 8 | 4 | 6894 ---------+--------+--------+… +--------+--------+ Total 3118 5507 8 4 10012 ed effettivamente troviamo 3118 individui che hanno il valore ‘.’ per la variabile ‘numero d’ordine della partnership’ Total number of partnerships Index number of partnership

33 33 Esempi di utilizzo dei files Es. Germania TABLE OF V218M_01 (Month start living together) BY IND21_01 (Index number partnership) Frequency|.| 1| Total ---------+--------+--------+. | 3118 | 0 | 3118 ---------+--------+--------+ 1 | 0 | 434 | 434 ---------+--------+--------+ 2 | 0 | 409 | 409 ---------+--------+--------+ 3 | 0 | 472 | 472 ---------+--------+--------+ 4 | 0 | 496 | 496 ---------+--------+--------+ 5 | 0 | 731 | 731 ---------+--------+--------+ … … ---------+--------+--------+ 11 | 0 | 334 | 334 ---------+--------+--------+ 12 | 0 | 345 | 345 ---------+--------+--------+ 98 | 0 | 667 | 667 ---------+--------+--------+ Total 3118 6894 10012 Index number of partnership Month start living together 667 persone fra quelle che hanno avuto almeno 1 unione dovevano rispondere sul mese di inizio, ma non l’hanno fatto.

34 34 Casi particolari USA: è stato predisposto un file in cui ogni riga è un individuo. Oltre ai dati e al programma di lettura in SPSS è anche presente il CODEBOOK ed un file informativo generale (README) sia in versione testo sia in versione per Word. Sono risultate incoerenti: La storia lavorativa degli intervistati per la Germania La storia dell’istruzione per l’Austria Sono disponibili i testi delle e-mail scambiate con i rappresentanti nazionali per avere delucidazioni su alcune variabili. Sono state richieste anche informazioni sui sistemi scolastici (Lituania e Lettonia) Ad esempio non hanno utilizzato la classificazione ISCED per l’istruzione

35 35 Casi particolari Per quanto riguarda l’Italia è possibile recuperare alcune variabili che non sono state incluse nello SRF, avendo cura di utilizzare l’opportuno codice identificativo della famiglia. 10000117131 00100001171311311951.1933 4 10000117131 0101 24321 10000117131 01023114321 10000117131 01034111514 10000117131 0104412 9 10000117131 01 Esso si trova nelle colonne 3-6 dello SRF


Scaricare ppt "1 Fertility and Family Survey Standard Recode Files."

Presentazioni simili


Annunci Google