La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Dipartimento di Economia e Giurisprudenza

Presentazioni simili


Presentazione sul tema: "Dipartimento di Economia e Giurisprudenza"— Transcript della presentazione:

1 Dipartimento di Economia e Giurisprudenza
INDAGINI CAMPIONARIE E SONDAGGI DEMOSCOPICI Prof.ssa Luisa Natale

2

3 INDAGINI CAMPIONARIE IL CAMPIONAMENTO

4 Domanda Perché i ricercatori preferiscono condurre indagini campionarie piuttosto che chiedere a ciascuno la propria opinione?

5 Risposta Speed/Velocità Minor tempo per condurre un’indagine campionaria rispetto a quello di un’indagine censuaria Accuracy/Precisione Migliore possibilità di controllo della qualità dei dati (è più facile verificare l’attendibilità di un piccolo gruppo di intervistati rispetto a quella di tutti) Quando non è possibile effettuare un’indagine censuaria per esempio nel caso di una fabbrica di fiammiferi che vuole conoscere la percentuale di fiammiferi che hanno dei difetti. Ci sono delle situazioni in cui i ricercatori distruggono le unità che devono essere testate (nell’esempio i fiammiferi) e quindi non è possibile fare un Censimento.

6 Exercise Fornire un esempio nel quale è preferibile usare un campione piuttosto che un censimento

7 Metodi di campionamento
CAMPIONI Probabilistici Casuale semplice Casuale stratificato Campionamento a grappolo Campionamento sistematico Non probabilistici Campionamento per quote Campionamento ragionato

8 Tipologie di campionamento
Campionamenti Probabilistici per i quali la probabilità che ogni unità del collettivo ha di far parte di un campione è nota Campionamenti Non Probabilistici per i quali la probabilità che ogni unità ha di essere estratta non è nota

9 Formazione dei campioni
1. SCELTA CASUALE (c. probabilistico), le unità del collettivo avranno tutti la stessa probabilità di essere inclusi nel campione; si tratta di scelta con metodo rigoroso che assicura l’imparzialità dell’inclusione di ogni unità del collettivo nel campione 2. SCELTA RAGIONATA (c. non probabilistico) le unità campionarie vengono individuate con procedimento razionale ma non del tutto casuale I campioni sono formati da unità che si ritiene possano rappresentare bene le caratteristiche della popolazione

10 CAMPIONI PROBABILISTI
Simple Random Sampling Stratified Random Sampling Cluster Sampling Systematic Sampling

11 C

12 Campione casuale semplice/Simple Random Sampling
Everyone in the population must have a specified chance of making it into the sample Every unit has the same chance of being the selected sample Pay attention You need a list of the unit of population You need a source of random numbers

13 Esercizio Sei di fronte ad una classe con 200 studenti e vieni a sapere che essi sono scontenti del metodo di insegnamento applicato in quel corso Decidi di selezionare un campione di 25 studenti. Quale è il margine di errore? Il 60% del campione dice di essere insoddisfatto. E la classe?

14 Esercizio Il margine di errore è (95%) ± 1/√n = 1/√25 = 20%
L’intera classe ….

15 L’ampiezza del campione incide sul margine di errore. Vero o falso?
Il margine di errore L’ampiezza del campione incide sul margine di errore. Vero o falso?

16 DOMANDA Case A. Tu scegli un campione di 1500 adulti da una popolazione di 1 milione di adulti per raccogliere alcune informazioni. Quale è il margine di errore? Case B. Tu scegli un campione di 1500 adulti da una popolazione di 5 milione di adulti per raccogliere alcune informazioni.

17 Soluzione Case A n=1500, 1/√1500 = 1/39 = 0. 026
Popolazione = N = 1 milione Case B n=1500, 1/√1500 = 1/39 = Popolazione = N = 5 milioni Il risultato non dipende da quanto è grande la popolazione. Il risultato dipende solo da quanto è grande il campione.

18 Come campionare all’interno della classe?
Sei di fronte ad una classe con 200 studenti e vieni a sapere che essi sono scontenti del metodo di insegnamento applicato in quel corso. Scegli 25 studenti. Si distinguono 3 fasi. Fase 1. Costruire una lista di studenti numerati da 1 a 200 E’ molto importante disporre di una lista di partenza, altrimenti questo tipo di campionamento “probabilistico” non può essere applicato

19 Fase 2. Obiettivo : ottenere 25 numeri casuali compresi tra 1 e 200.
Come procedere? Due possibilità alternative 1) manualmente cioè mettendo tutte le palline numerate (da 1 a 200) in una scatola e successivamente estraendone 25. 2) consultando un programma di generazione elettronica di numeri casuali. Se usate quello di Exel seguire questo percorso Inserisci funzione matematiche/tric. scegli Casuale Tra. In questo modo il programma fornisce 25 numeri casuali interi compresi tra 1 e 200

20 Fase 2. Ecco i numeri estratti 31, 141, 35, 69, 100, 182, 61, 116, 191, 161, 129, 120, 150, 15, 84, 194, 135, 101, 44, 163, 152, 39, 99, 110, 36 Fase 3 Ora è possibile contattare ed intervistare le 25 persone che sono state estratte dalla lista di partenza. Fare attenzione “alla reperibilità delle persone”. Limitare le distorsioni

21 Campione casuale stratificato
Quando si utilizza: se la popolazione è molto elevata, per cui è difficile numerare tutti gli elementi e si corre il rischio di non inserire nel campione elementi d’interesse. Come si costruisce. Si divide la popolazione in gruppi/strati (per esempio le regioni di una nazione, i partiti politici) e successivamente si estrae un campione casuale per ciascun gruppo

22 Campionamento stratificato
DEFINIZIONE ISTAT Nel campionamento stratificato la popolazione viene suddivisa in sottopopolazioni dette strati, secondo alcune variabili di stratificazione. La stratificazione risponde a diversi obiettivi, quale ad esempio, quello di caratterizzare l'indagine per aree geografiche, pur mantenendo casuale la struttura di selezione del campione in ogni strato. La scelta della variabile di stratificazione dovrebbe soddisfare l'esigenza di ottenere strati all’interno dei quali la variabilità del fenomeno sia approssimativamente costante (internamente omogenei) e tra i quali essa sia invece massima (esternamente eterogenei).

23 Campione stratificato
FASE 1. Classificazione delle unità statistiche in un certo numero di classi (STRATI); COME RAGGRUPPARE Il raggruppamento deve essere fatto in modo che ciascun elemento compaia in un solo strato; Gli elementi appartenenti allo stesso strato devono essere simili tra loro (classi omogenee);

24 Campione stratificato
Se si intende stimare il reddito di un popolazione tramite un campione di individui, va stratificata la popolazione in classi di reddito omogenee). FASE 2. Estrazione in modo casuale dalle classi del campione

25 Campione c. stratificato
VANTAGGI 1. E’ possibile trovare stime per ciascuno strato 2. Possiamo usare diversi intervistatori per ciascuno strato 3. Se gli stati sono distinti geograficamente questo implica un minor costo

26 Esercizio Vuoi svolgere un’indagine campionaria tra le aziende della tua provincia. Le aziende sono 5000, ne vuoi campionare 100. Hai a tua disposizione l’elenco telefonico delle aziende ordinato per tipologia (le “pagine gialle”). Con quale criterio sceglieresti le aziende ? Perché non è una buona idea selezionare le prime 100 aziende dell’elenco ?

27 CAMPIONE SISTEMATICO E’ una variante del campionamento casuale semplice molto efficiente da realizzare quando si disponga della lista delle unità statistiche della popolazione sotto forma di file elaborabile al computer. Viene praticato estraendo un numero a caso tra 1 e N (numerosità della Popolazione) e inserendo nel campione l’unità corrispondente nella lista.

28 CAMPIONE SISTEMATICO Le unità successive sono scelte scorrendo la lista a partire dalla prima unità prescelta e selezionando nuove unità con un passo dato dal rapporto N/n, dove n è il numero di unità che si vogliono inserire nel campione. ll procedimento deve essere tale che, una volta giunti in fondo alla lista delle N unità, occorre proseguire il conteggio a partire dall’inizio della lista. Il procedimento termina quando sono state selezionate tutte le n unità da campionare.

29 Domanda Supponiamo di aver una lista di 5000 nomi e relativi numeri telefonici. Si vuole selezionare un campione di 100 numeri. Come posso scegliere i numeri a cui telefonare?

30 Campione sistematico Si selezione 1 ogni 50 numeri. Partendo da un primo numero che viene estratto in modo casuale (p.e il numero 20, poi il 70 etc). Possibile distorsione- attenzione a…. . In un’indagine sulle residenze universitarie si vuole valutare i potenziali disturbi per il rumore derivanti dal sovraffollamento. Per ogni piano ci sono 20 stanze ciascuna con 2 studenti. Si adotta un passo di 40. La scelta è corretta?

31 Vantaggi/svantaggi Sebbene molto efficiente da implementare, questo procedimento di stima può condurre a distorsioni se l’ordine in cui le unità sono disposte tende ad avere una ricorrenza associata alla caratteristica di interesse. Consideriamo, ad esempio, una lista di abitazioni elencate, per ogni quartiere, secondo la loro dimensione. E’ possibile che, effettuando un campionamento sistematico di dimensione n pari al numero dei quartieri, si possano selezionare tutte abitazioni molto grandi o molto piccole.

32 Campionamento a grappolo
La popolazione viene divisa in gruppi (chiamati clusters) ma piuttosto che campionare all’interno di ciascun gruppo si selezionano casualmente alcuni clusters e si contattano solo questi. Ventaggio. È necessaria una lista dei clusters e non una lista di tutte le unità.

33 Esempio 1. In un ateneo ci sono 30 residenze universitarie, ognuna composta da 6 piani. I 180 piani potrebbero essere considerati come 180 clusters di unità. Si possono selezionare casualmente i piani e contattare tutti nel piano

34 Esempio 2. Supponiamo di dividere la città in 100 quartieri, se invece di scegliere a caso le unità statistiche da ogni quartiere, scegliamo un gruppo di quartieri per poi campionare tutti gli abitanti

35 Vantaggi/svantaggi Le caratteristiche rilevate con questo tipo di campionamento sono tanto meno precise quanto più omogenei sono gli elementi appartenenti allo stesso grappolo e quanto più grandi sono le differenze tra i vari grappoli Si può avere errore di campionamento tanto elevato da rendere inattendibile la stima effettuata

36 Quale campionamento? 1. lista dei voli e selezione casuale di 25 voli, intervistati tutti i passeggeri di questi 25 voli 2. Suddivisione della città in isolati (gruppi di palazzi), estrazione per ogni isolato del palazzo che si trova sul lato sud, poi dell’appartamento che si trova al primo piano lato nord-est FORNIRE ESEMPI di CAMPIONAMENTO

37 CAMPIONI NON PROBABILISTICI

38 Il campionamento per quote (1)
E’ un campionamento “a scelta ragionata”, Si utilizza quando non è possibile avere una lista delle persone che appartengono alla popolazione da cui si vuole estrarre il campione da intervistare (realizzato come un campione di comodo) Vincoli è necessario rispettare le “quote”. Cosa vuol dire? Campione e popolazione devono avere pari quote di persone con un determinato carattere (p.e. sesso, età, livello di istruzione, zona di residenza, condizione professionale) secondo l'idea che, a parità di composizione strutturale, il campione possa ritenersi rappresentativo della popolazione di riferimento.

39 Il campionamento per quote (2)
Limiti : consiste nel fatto che la disponibilità all'intervista - essendo determinata da fattori quali abitudini, reperibilità e predisposizione psicologica - può condurre alla sottostima sistematica della variabilità esistente nella popolazione (fatto tipico nel campionamento per quote).

40 Campionamento per quote: esercizio
Si vuole effettuare un’indagine in 2 città per conoscere l’atteggiamento vs il Made in Italy. In totale le interviste da fare sono 500 (cfr. tabella). Come determinare il campione?

41 Campionamento per quote: esercizio
1. Scelta delle variabili e dei livelli che servono per stratificare il campione di intervistati. 2. Contabilizzare tutti i possibili incroci tra i livelli. 3. Ripartizione delle interviste in maniera uniforme o non. 4. Arrotondamento all’intero successivo del risultato ottenuto

42 Campionamento per quote: esercizio
Fase 1. Le seguenti tre variabili possono essere utilizzate per stratificare il campione di intervistati: Genere (due livelli: Donne, Uomini) Titolo di studio (tre livelli: fino alla scuola media, diploma, laurea e più) Età (quattro livelli: 25-34, 35-44, 45-54, oltre 55)

43 Campionamento per quote: esercizio
Fase 2. Quante caselle? 2x3x4= 24 a Cassino; 2x3x4= 24 a Roma Come ripartire gli intervistati? Cassino 150/24= approssimato = 7; Roma 350/24= = approssimato = 15

44 INTERVISTE A CASSINO =? Età /Titolo di studio Interviste DONNE = ? Interviste UOMINI=? I modalità II modalità III modalità Totale II mod. III mod. Prima classe Seconda cl. Terza cl. Quarta cl.

45 Soluzione

46 Campionamento per quote: esercizio 2
Il committente dell’indagine ha per motivi di tempo deciso di ridurre il numero di interviste. Cassino 120 Roma 280 Costruire la tabelle con il campionamento per quote, mantenendo le stesse variabili di stratificazione (sesso, età, titolo di studio).

47 Riponderazione Nel caso sarà poi possibile considerare il differente peso dei vari incroci considerati nella popolazione di provenienza considerando opportuni pesi di riponderazione.

48 Popolazione residente a Cassino per sesso, grande classe di età e titolo di studio
Donne Totale Uomini Titolo di studio Fino scuola media Diploma Almeno laurea 25-34 1650 2500 850 5000 1980 3000 1020 6000 35-44 2800 2450 1750 7000 2880 2520 1800 7200 45-54 3600 2160 1440 3500 2100 1400 55 e + 6930 2625 945 10500 5280 2000 720 8000 14980 9735 4985 29700 13640 9620 4940 28200

49

50

51

52

53 MATERIALI da LEGGERE Alcuni metodi di campionamento (dal sito ISTAT):


Scaricare ppt "Dipartimento di Economia e Giurisprudenza"

Presentazioni simili


Annunci Google