Dipartimento di Economia e Giurisprudenza

Slides:



Advertisements
Presentazioni simili
Statistica Descrittiva e Statistica Inferenziale
Advertisements

Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Campionamento procedimento attraverso il quale si estrae, da un insieme di unità (popolazione) costituenti l’oggetto delle studio, un numero ridotto di.
Introduzione all’uso degli indicatori di valutazione ed ai metodi di valutazione Dott.ssa Gabriella Giuliano Direttore Sanitario CREAS-IFC-CNR giugno.
LA STATISTICA. Cenni storici ● In Egitto: si rilevava l'ammontare della popolazione e i vari beni ai fini fiscali; si tenevano elenchi delle famiglie.
Indagine Cinture di Sicurezza Dr. Roberto Turra Sistema Epidemiologico Regionale (SER)
Indici di Posizione Giulio Vidotto Raffaele Cioffi.
Precorso di Statistica per le Lauree Magistrali
Statistica I Grafici Seconda Parte.
LA STATISTICA DESCRITTIVA
© 2007 SEI-Società Editrice Internazionale, Apogeo
INTRODUZIONE ALLA STATISTICA
Analisi monovariata: frequenze
I COMPORTAMENTI DI SPESA DELLE FAMIGLIE DURANTE LA CRISI
La ricerca sociale di tipo quantitativo
Giovanni Finaldi Russo Pietro Bruno
Valutazione dell’incertezza associata alla mappa acustica dinamica di Milano Giovanni Zambon; Roberto Benocci; Maura Smiraglia; H. Eduardo Roman.
Variabili casuali a più dimensioni
Comune di Catania – Servizi Demografici Decentramento e Statistica
RICHIAMI DI INFERENZA:
Misure dei valori centrali
Statistica Prima Parte I Dati.
GLI STRUMENTI AUSILIARI
Tre diversi materiali:
Indicatori Europei di sostenibilità ambientale
L’analisi monovariata
L’Ispettorato Generale per i Rapporti Finanziari con l’Unione Europea
Misure Meccaniche e Termiche - Università di Cassino
La dimensione del campione
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Analisi delle Traiettorie: Modelli di Crescita Latente (LGM)
Cluster Analysis Definizione di Classificazione: operazione concettuale condotta adottando un solo criterio (detto fondamento della divisione) per individuare.
La statistica A cura di: Manuela Mangione.
Modulo 3 Costituzione del consorzio dei partner
Obiettivi e fasi dell’indagine
APPUNTI DI STATISTICA INFERENZIALE
La Statistica si occupa dei modi
Precorso di Statistica per le Lauree Magistrali
IL RUOLO E L’IMMAGINE DELLA PROVINCIA PER I CITTADINI
IL CAMPIONAMENTO NELLA
Ripasso dei concetti fondamentali
La Statistica Istituto Comprensivo “ M. G. Cutuli”
Università degli Studi di Teramo Facoltà di Agraria
Alcuni richiami e definizioni (1)
Esercitazione di Statistica Economica
Esercitazione di Statistica Economica
Presentazione dei risultati
Statistica descrittiva
L’indagine statistica
Statistica Scienza che studia i fenomeni collettivi.
I numeri relativi DEFINIZIONE. Si dicono numeri relativi tutti i numeri interi, razionali e irrazionali dotati di segno (positivo o negativo). ESEMPI Numeri.
Indagine sulla qualità dell’insegnamento scolastico in Italia
La distribuzione campionaria: principi generali
32 = 9 x2 = 9 x = 3 32 = 9 √9 = 3 L’estrazione di radice
Corsi di Laurea in Biotecnologie
Riduzione dei Dati.
Fogli elettronici e videoscrittura
Precorso di Statistica per le Lauree Magistrali
MODALITA’ DI SOMMINISTRAZIONE
RICHIAMI DI INFERENZA:
Esercizio 1 Si vuole studiare la mobilità di voto degli elettori di una certa circoscrizione. Da un sondaggio telefonico risulta che: Si calcolino le distribuzioni.
RICHIAMI DI INFERENZA:
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
Corso di Analisi Statistica per le Imprese
Test per campioni indipendenti
La dimensione del campione
Frequenza a) Compilare una tabella classificando i compagni di classe secondo lo sport che preferiscono b) Compilare una tabella classificando i compagni.
Corso di Analisi Statistica per le Imprese
Il questionario: progettazione e redazione II Modulo
L’Analisi della Varianza ANOVA (ANalysis Of VAriance)
Transcript della presentazione:

Dipartimento di Economia e Giurisprudenza INDAGINI CAMPIONARIE E SONDAGGI DEMOSCOPICI Prof.ssa Luisa Natale http://www.docente.unicas.it/luisa_natale/ Email oli59@mclink.it

INDAGINI CAMPIONARIE IL CAMPIONAMENTO

Domanda Perché i ricercatori preferiscono condurre indagini campionarie piuttosto che chiedere a ciascuno la propria opinione?

Risposta Speed/Velocità Minor tempo per condurre un’indagine campionaria rispetto a quello di un’indagine censuaria Accuracy/Precisione Migliore possibilità di controllo della qualità dei dati (è più facile verificare l’attendibilità di un piccolo gruppo di intervistati rispetto a quella di tutti) Quando non è possibile effettuare un’indagine censuaria per esempio nel caso di una fabbrica di fiammiferi che vuole conoscere la percentuale di fiammiferi che hanno dei difetti. Ci sono delle situazioni in cui i ricercatori distruggono le unità che devono essere testate (nell’esempio i fiammiferi) e quindi non è possibile fare un Censimento.

Exercise Fornire un esempio nel quale è preferibile usare un campione piuttosto che un censimento

Metodi di campionamento CAMPIONI Probabilistici Casuale semplice Casuale stratificato Campionamento a grappolo Campionamento sistematico Non probabilistici Campionamento per quote Campionamento ragionato

Tipologie di campionamento Campionamenti Probabilistici per i quali la probabilità che ogni unità del collettivo ha di far parte di un campione è nota Campionamenti Non Probabilistici per i quali la probabilità che ogni unità ha di essere estratta non è nota

Formazione dei campioni 1. SCELTA CASUALE (c. probabilistico), le unità del collettivo avranno tutti la stessa probabilità di essere inclusi nel campione; si tratta di scelta con metodo rigoroso che assicura l’imparzialità dell’inclusione di ogni unità del collettivo nel campione 2. SCELTA RAGIONATA (c. non probabilistico) le unità campionarie vengono individuate con procedimento razionale ma non del tutto casuale I campioni sono formati da unità che si ritiene possano rappresentare bene le caratteristiche della popolazione

CAMPIONI PROBABILISTI Simple Random Sampling Stratified Random Sampling Cluster Sampling Systematic Sampling

C

Campione casuale semplice/Simple Random Sampling Everyone in the population must have a specified chance of making it into the sample Every unit has the same chance of being the selected sample Pay attention You need a list of the unit of population You need a source of random numbers

Esercizio Sei di fronte ad una classe con 200 studenti e vieni a sapere che essi sono scontenti del metodo di insegnamento applicato in quel corso Decidi di selezionare un campione di 25 studenti. Quale è il margine di errore? Il 60% del campione dice di essere insoddisfatto. E la classe?

Esercizio Il margine di errore è (95%) ± 1/√n = 1/√25 = 20% L’intera classe ….

L’ampiezza del campione incide sul margine di errore. Vero o falso? Il margine di errore L’ampiezza del campione incide sul margine di errore. Vero o falso?

DOMANDA Case A. Tu scegli un campione di 1500 adulti da una popolazione di 1 milione di adulti per raccogliere alcune informazioni. Quale è il margine di errore? Case B. Tu scegli un campione di 1500 adulti da una popolazione di 5 milione di adulti per raccogliere alcune informazioni.

Soluzione Case A n=1500, 1/√1500 = 1/39 = 0. 026 Popolazione = N = 1 milione Case B n=1500, 1/√1500 = 1/39 = 0. 026 Popolazione = N = 5 milioni Il risultato non dipende da quanto è grande la popolazione. Il risultato dipende solo da quanto è grande il campione.

Come campionare all’interno della classe? Sei di fronte ad una classe con 200 studenti e vieni a sapere che essi sono scontenti del metodo di insegnamento applicato in quel corso. Scegli 25 studenti. Si distinguono 3 fasi. Fase 1. Costruire una lista di studenti numerati da 1 a 200 E’ molto importante disporre di una lista di partenza, altrimenti questo tipo di campionamento “probabilistico” non può essere applicato

Fase 2. Obiettivo : ottenere 25 numeri casuali compresi tra 1 e 200. Come procedere? Due possibilità alternative 1) manualmente cioè mettendo tutte le palline numerate (da 1 a 200) in una scatola e successivamente estraendone 25. 2) consultando un programma di generazione elettronica di numeri casuali. Se usate quello di Exel seguire questo percorso Inserisci funzione matematiche/tric. scegli Casuale Tra. In questo modo il programma fornisce 25 numeri casuali interi compresi tra 1 e 200

Fase 2. Ecco i numeri estratti 31, 141, 35, 69, 100, 182, 61, 116, 191, 161, 129, 120, 150, 15, 84, 194, 135, 101, 44, 163, 152, 39, 99, 110, 36 Fase 3 Ora è possibile contattare ed intervistare le 25 persone che sono state estratte dalla lista di partenza. Fare attenzione “alla reperibilità delle persone”. Limitare le distorsioni

Campione casuale stratificato Quando si utilizza: se la popolazione è molto elevata, per cui è difficile numerare tutti gli elementi e si corre il rischio di non inserire nel campione elementi d’interesse. Come si costruisce. Si divide la popolazione in gruppi/strati (per esempio le regioni di una nazione, i partiti politici) e successivamente si estrae un campione casuale per ciascun gruppo

Campionamento stratificato DEFINIZIONE ISTAT Nel campionamento stratificato la popolazione viene suddivisa in sottopopolazioni dette strati, secondo alcune variabili di stratificazione. La stratificazione risponde a diversi obiettivi, quale ad esempio, quello di caratterizzare l'indagine per aree geografiche, pur mantenendo casuale la struttura di selezione del campione in ogni strato. La scelta della variabile di stratificazione dovrebbe soddisfare l'esigenza di ottenere strati all’interno dei quali la variabilità del fenomeno sia approssimativamente costante (internamente omogenei) e tra i quali essa sia invece massima (esternamente eterogenei).

Campione stratificato FASE 1. Classificazione delle unità statistiche in un certo numero di classi (STRATI); COME RAGGRUPPARE Il raggruppamento deve essere fatto in modo che ciascun elemento compaia in un solo strato; Gli elementi appartenenti allo stesso strato devono essere simili tra loro (classi omogenee);

Campione stratificato Se si intende stimare il reddito di un popolazione tramite un campione di individui, va stratificata la popolazione in classi di reddito omogenee). FASE 2. Estrazione in modo casuale dalle classi del campione

Campione c. stratificato VANTAGGI 1. E’ possibile trovare stime per ciascuno strato 2. Possiamo usare diversi intervistatori per ciascuno strato 3. Se gli stati sono distinti geograficamente questo implica un minor costo

Esercizio Vuoi svolgere un’indagine campionaria tra le aziende della tua provincia. Le aziende sono 5000, ne vuoi campionare 100. Hai a tua disposizione l’elenco telefonico delle aziende ordinato per tipologia (le “pagine gialle”). Con quale criterio sceglieresti le aziende ? Perché non è una buona idea selezionare le prime 100 aziende dell’elenco ?

CAMPIONE SISTEMATICO E’ una variante del campionamento casuale semplice molto efficiente da realizzare quando si disponga della lista delle unità statistiche della popolazione sotto forma di file elaborabile al computer. Viene praticato estraendo un numero a caso tra 1 e N (numerosità della Popolazione) e inserendo nel campione l’unità corrispondente nella lista.

CAMPIONE SISTEMATICO Le unità successive sono scelte scorrendo la lista a partire dalla prima unità prescelta e selezionando nuove unità con un passo dato dal rapporto N/n, dove n è il numero di unità che si vogliono inserire nel campione. ll procedimento deve essere tale che, una volta giunti in fondo alla lista delle N unità, occorre proseguire il conteggio a partire dall’inizio della lista. Il procedimento termina quando sono state selezionate tutte le n unità da campionare.

Domanda Supponiamo di aver una lista di 5000 nomi e relativi numeri telefonici. Si vuole selezionare un campione di 100 numeri. Come posso scegliere i numeri a cui telefonare?

Campione sistematico Si selezione 1 ogni 50 numeri. Partendo da un primo numero che viene estratto in modo casuale (p.e il numero 20, poi il 70 etc). Possibile distorsione- attenzione a…. . In un’indagine sulle residenze universitarie si vuole valutare i potenziali disturbi per il rumore derivanti dal sovraffollamento. Per ogni piano ci sono 20 stanze ciascuna con 2 studenti. Si adotta un passo di 40. La scelta è corretta?

Vantaggi/svantaggi Sebbene molto efficiente da implementare, questo procedimento di stima può condurre a distorsioni se l’ordine in cui le unità sono disposte tende ad avere una ricorrenza associata alla caratteristica di interesse. Consideriamo, ad esempio, una lista di abitazioni elencate, per ogni quartiere, secondo la loro dimensione. E’ possibile che, effettuando un campionamento sistematico di dimensione n pari al numero dei quartieri, si possano selezionare tutte abitazioni molto grandi o molto piccole.

Campionamento a grappolo La popolazione viene divisa in gruppi (chiamati clusters) ma piuttosto che campionare all’interno di ciascun gruppo si selezionano casualmente alcuni clusters e si contattano solo questi. Ventaggio. È necessaria una lista dei clusters e non una lista di tutte le unità.

Esempio 1. In un ateneo ci sono 30 residenze universitarie, ognuna composta da 6 piani. I 180 piani potrebbero essere considerati come 180 clusters di unità. Si possono selezionare casualmente i piani e contattare tutti nel piano

Esempio 2. Supponiamo di dividere la città in 100 quartieri, se invece di scegliere a caso le unità statistiche da ogni quartiere, scegliamo un gruppo di quartieri per poi campionare tutti gli abitanti

Vantaggi/svantaggi Le caratteristiche rilevate con questo tipo di campionamento sono tanto meno precise quanto più omogenei sono gli elementi appartenenti allo stesso grappolo e quanto più grandi sono le differenze tra i vari grappoli Si può avere errore di campionamento tanto elevato da rendere inattendibile la stima effettuata

Quale campionamento? 1. lista dei voli e selezione casuale di 25 voli, intervistati tutti i passeggeri di questi 25 voli 2. Suddivisione della città in isolati (gruppi di palazzi), estrazione per ogni isolato del palazzo che si trova sul lato sud, poi dell’appartamento che si trova al primo piano lato nord-est FORNIRE ESEMPI di CAMPIONAMENTO

CAMPIONI NON PROBABILISTICI

Il campionamento per quote (1) E’ un campionamento “a scelta ragionata”, Si utilizza quando non è possibile avere una lista delle persone che appartengono alla popolazione da cui si vuole estrarre il campione da intervistare (realizzato come un campione di comodo) Vincoli è necessario rispettare le “quote”. Cosa vuol dire? Campione e popolazione devono avere pari quote di persone con un determinato carattere (p.e. sesso, età, livello di istruzione, zona di residenza, condizione professionale) secondo l'idea che, a parità di composizione strutturale, il campione possa ritenersi rappresentativo della popolazione di riferimento.

Il campionamento per quote (2) Limiti : consiste nel fatto che la disponibilità all'intervista - essendo determinata da fattori quali abitudini, reperibilità e predisposizione psicologica - può condurre alla sottostima sistematica della variabilità esistente nella popolazione (fatto tipico nel campionamento per quote).

Campionamento per quote: esercizio Si vuole effettuare un’indagine in 2 città per conoscere l’atteggiamento vs il Made in Italy. In totale le interviste da fare sono 500 (cfr. tabella). Come determinare il campione?

Campionamento per quote: esercizio 1. Scelta delle variabili e dei livelli che servono per stratificare il campione di intervistati. 2. Contabilizzare tutti i possibili incroci tra i livelli. 3. Ripartizione delle interviste in maniera uniforme o non. 4. Arrotondamento all’intero successivo del risultato ottenuto

Campionamento per quote: esercizio Fase 1. Le seguenti tre variabili possono essere utilizzate per stratificare il campione di intervistati: Genere (due livelli: Donne, Uomini) Titolo di studio (tre livelli: fino alla scuola media, diploma, laurea e più) Età (quattro livelli: 25-34, 35-44, 45-54, oltre 55)

Campionamento per quote: esercizio Fase 2. Quante caselle? 2x3x4= 24 a Cassino; 2x3x4= 24 a Roma Come ripartire gli intervistati? Cassino 150/24= 6.25 approssimato = 7; Roma 350/24= 14.58 = approssimato = 15

INTERVISTE A CASSINO =? Età /Titolo di studio Interviste DONNE = ?   Interviste UOMINI=? I modalità II modalità III modalità Totale II mod. III mod. Prima classe Seconda cl. Terza cl. Quarta cl.

Soluzione

Campionamento per quote: esercizio 2 Il committente dell’indagine ha per motivi di tempo deciso di ridurre il numero di interviste. Cassino 120 Roma 280 Costruire la tabelle con il campionamento per quote, mantenendo le stesse variabili di stratificazione (sesso, età, titolo di studio).

Riponderazione Nel caso sarà poi possibile considerare il differente peso dei vari incroci considerati nella popolazione di provenienza considerando opportuni pesi di riponderazione.

Popolazione residente a Cassino per sesso, grande classe di età e titolo di studio Donne Totale Uomini   Titolo di studio Fino scuola media Diploma Almeno laurea 25-34 1650 2500 850 5000 1980 3000 1020 6000 35-44 2800 2450 1750 7000 2880 2520 1800 7200 45-54 3600 2160 1440 3500 2100 1400 55 e + 6930 2625 945 10500 5280 2000 720 8000 14980 9735 4985 29700 13640 9620 4940 28200

MATERIALI da LEGGERE Alcuni metodi di campionamento (dal sito ISTAT): http://www.istat.it/strumenti/metodi/lineeguida/13.htm