Il campionamento.

Slides:



Advertisements
Presentazioni simili
Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Advertisements

Lassicurazione della qualità come opportunità di sviluppo CONSERVATORIO DI MUSICA ARRIGO BOITO DI PARMA 14 marzo 2009 Metodologie di analisi e di interpretazione.
Alcuni aspetti chiave e preliminari:
LA VARIABILITA’ IV lezione di Statistica Medica.
STATISTICA DESCRITTIVA
STATISTICA DESCRITTIVA
Intervalli di confidenza
Sondages Corso di campionamento Sandro Squarcia Statistica Matematica e Trattamento Informatico dei Dati (SMID) IUT Nice – Côte dAzur Département STID.
Statistica Descrittiva e Statistica Inferenziale
Analisi dei dati per i disegni ad un fattore
Campione e campionamento
valore osservato = valore vero + e. sistematico + e. accidentale
CAMPIONE E CAMPIONAMENTO
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°2.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Inferenza statistica per un singolo campione
CAMPIONAMENTO Estratto dal Cap. 5 di:
LE RILEVAZIONI NEL SETTORE AGRICOLO (Loretta Lolli)
Appunti di inferenza per farmacisti
Campionamento Capitolo 3.
STATISTICA a.a PARAMETRO t DI STUDENT
Cap. 2 Definizioni e notazione (simboli) di base
Le tecniche di somministrazione del questionario
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 5 Strumenti statistici: campioni e stimatori
Indagine multiscopo F A S I 1 a FASE: PROGETTAZIONEobiettivi, unità, costi, tempi 2 a FASE: RILEVAZIONEraccolta informazioni tramite questionario 3 a.
Verifica delle ipotesi su due campioni di osservazioni
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Le distribuzioni campionarie
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
Statistica Che cos’è?.
CAMPIONAMENTO PER CENTRI
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Metodologia della ricerca sociale lorenzo bernardi
STATISTICA INFERENZIALE
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.
Statistica La statistica è
Il campionamento.
Si parla di campionamento probabilistico quando le unità sono selezionate con meccanismo casuale e hanno tutte una probabilità nota e non nulla di.
Accenni di analisi monovariata e bivariata
Corso di Analisi Statistica per le Imprese
IL CAMPIONE.
“Teoria e metodi della ricerca sociale e organizzativa”
Analisi e Gestione del Rischio Lezione 7 Prodotti con pay-off non lineare.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
“Teoria e metodi della ricerca sociale e organizzativa”
Intervalli di confidenza
Metodologia della Ricerca Sociale
Il campionamento: esempio di campionamento in un indagine Multiscopo
La distribuzione campionaria della media
Quarta Esercitazione Metodologia della Ricerca Sociale a.a
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
Studio fenomeni collettivi
TRATTAMENTO STATISTICO DEI DATI ANALITICI
____________________________ Stefano Scarcella Prandstraller Relazioni istituzionali e Gestione della responsabilità sociale d’impresa Metodo e tecniche.
STATISTICA P IA F ONDAZIONE DI C ULTO E R ELIGIONE C ARD. G. P ANICO Azienda Ospedaliera CORSO DI LAUREA IN INFERMIERISTICA Sr. Margherita Bramato.
I disegni sperimentali e il controllo 1. Procedure del controllo 2. Disegni monofattoriali 3. Disegni multifattoriali.
Cos’è la ricerca sociale? La raccolta di informazioni relative ad una realtà, ad un fenomeno sociale secondo obiettivi specifici:
Campionamento procedimento attraverso il quale si estrae, da un insieme di unità (popolazione) costituenti l’oggetto delle studio, un numero ridotto di.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Campionamento.
6 Inchiesta Giulio Vidotto Raffaele Cioffi. Indice: 6.1 Come si prepara un questionario 6.2 Come somministrare un questionario 6.3 Campionamento.
Il DEFF Il DEFF (Design EFFect) è l’Effetto del Piano di
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

Il campionamento

Il campionamento Vantaggi (per es. rispetto a un censimento): Riduzione dei costi Riduzione dei tempi Maggiore accuratezza e approfondimento Rischi: Errori di copertura (es. la lista di campionamento) Errori di non risposta (rifiuti, mancati contatti, missing o altro) Errore di campionamento (il campione non riflette adeguatamente la popolazione target, es. autoselezione) Dimensione campionaria inadeguata (ampiezza)

…qualche definizione L’universo= la popolazione “teorica” oggetto di indagine La popolazione = l’insieme dei soggetti sui quali viene effettivamente svolta la ricerca sulla base di una lista di campionamento Unità di analisi= il singolo caso rilevante per la ricerca, i soggetti dentro la lista di campionamento della popolazione Il campione = il sottoinsieme della popolazione cui vengono applicati gli strumenti d’indagine I casi= le unità di analisi scelte che finiscono nel campione Il campionamento = il procedimento di selezione (nelle intenzioni, rappresentativa) dei casi dalla popolazione al campione

(procedimento induttivo) (procedimento deduttivo) Universo: i lavoratori atipici della provincia di Genova Popolazione di riferimento: i lavoratori atipici rilevabili nelle liste dei CPI 13 23 17 Stima (procedimento induttivo) 4 11 campione 22 3 18 15 1 1 16 7 25 CAMPIONAMENTO 11 14 12 16 21 7 2 5 10 9 91 20 Inferenza (procedimento deduttivo) 19 24 25 20 6 8 casi Unità di analisi

La rappresentatività (I) Occorre che il campione possegga le caratteristiche della popolazione di origine e le riproduca in piccola scala. 2 fattori: Numerosità: quante unità di analisi finiscono nel campione, tanto più cresce n avvicinandosi a N, tanto più il campione è rappresentativo Eterogeneità: quanto le unità di analisi sono diverse tra loro all’origine, tanto più il campione rispecchia l’eterogeneità, tanto più è rappresentativo

La rappresentatività (II) Alcuni criteri per un’adeguata rappresentatività: occorre che i dati di partenza siano generalmente validi non si devono verificare effetti di selezione campione e popolazione devono avere distribuzioni simili si rifletta la presenza di possibili caso idealtipici adeguata copertura della popolazione (riflettere le variazioni) usare un campione probabilistico (p>0 e noto)

Il campionamento La selezione delle unità di analisi che divengono casi del campione può avvenire con 2 metodi Probabilistico: le unità della popolazione hanno prefissate, medesime e conoscibili probabilità di essere incluse nel campione Non probabilistico: non si conoscono le probabilità di inclusione

La numerosità …dove n = la numerosità che si vuole ottenere z = costante (corrispondente al valore della variabile casuale normale standardizzata) che dipende dal livello di fiducia desiderato per la stima es. 1,96 per un livello di fiducia del 95%; 1 per il 68% = lo scarto quadratico medio (l’indice di variabilità) e= l’errore atteso

Esempio errore di stima dalla media= 0,2 livello di fiducia del 95% =1,96 variabilità = 3 n= 1,96 * (3/0,2) = 29,4 che elevato al quadrato= 864,36 non è sensato fare elaborazioni sotto 30 casi per un minimo di descrizione meglio ancora non andare sotto i 100 per una popolazione estesa spesso oltre 1000 casi non si aggiunge rappresentatività (per variabili poco eterogenee)

La ponderazione es. da una popolazione di 500 M e 1000 F… …un campione stratificato x età di 100 M e 100 F …farà sì che le risposte delle 100 F valgano doppio

N La curva normale M, Mo, Me -1Sq e +1 Sq = 68% dei casi -3Sq -2Sq -1Sq +1Sq +2Sq +3Sq

Campionamenti probabilistici (tipici della ricerca standard) Casuale semplice (con o senza ripetizione) Sistematico Stratificato (proporzionale/non proporzionale) A grappoli A stadi Areale

Probabilistici: Casuale semplice Estraggo a caso dalla lista di campionamento garantendo a tutte le unità di analisi la stessa possibilità di entrare a far parte del campione Con o senza ripetizione, ovvero estraggo e tolgo o estraggo e rimetto (raro)

Probabilistici: sistematico Estraggo a caso ogni tot dalla lista, ovvero definisco un passo di campionamento, cioè estraggo un caso ogni k, dove k=n/N (*100) Es. per n=1000 e N=50000, k=50 Se N non è noto posso usare un k arbitrario Definito k estraggo a caso un numero tra 1 e k (nel nostro caso 1tra 1 e 50) e inizio il passo di campionamento (ne prendo 1 ogni 50 a partire dal numero estratto) …proseguo a estrarre con il passo fino a raggiungere la numerosità Si può fare anche quando non c’è una lista

Probabilistici: Stratificato Definisco strati su popolazione rispetto a variabili fondamentali Rispetto alle unità di analisi gli strati devono essere omogenei al loro interno (intra) e eterogenei tra loro (inter) Posso seguire un criterio di ripartizione proporzionale o non proporzionale all’incidenza degli strati rispetto alla popolazione di origine Piano fattoriale ovvero definisco a priori delle variabili che ritengo influenzino il fenomeno. Es. genere (2 modalità, M/F), età (2 modalità, under 40/over 40) ; titolo di studio (3 modalità, basso,medio,alto). Si ottengono 2X2X3=12 combinazioni e in ognuna dovrò selezionare lo stesso numero di casi (in questo modo posso valutare meglio l’influenza delle variabili equiparandone il peso)

Probabilistici: a grappoli Suddivido popolazione in sottoinsiemi (grappoli) es. divido una popolazione di scuole per regioni/province/comuni Scelta casuale sui grappoli es. seleziono casualmente Rilevo su tutte le unità dei grappoli scelti Es. scelti a caso 1 e 3, rilevo su tutte le unità di 1 e 3 4 3 1 2

Probabilistici: a stadi (2 o +) Suddivido popolazione in sottoinsiemi (unità di primo stadio)…es. regioni Scelta casuale dei sottoinsiemi su unità di primo stadio Scelta casuale delle unità selezionate in primo stadio (secondo stadio) Es. su 3 stadi per studenti scuole medie italiane: I stadio - scelta casuale tra comuni d’Italia II stadio - scelta casuale tra scuole medie dei comuni scelti III stadio - scelta casuale tra gli studenti delle scuole scelte dei comuni scelti

Probabilistici …naturalmente, niente e nessuno mi impedisce di poter combinare le tecniche anzidette…es un campionamento areale stratificato con passo sistematico

Guida alla definizione di un campione Definire la popolazione in spazio e tempo Elencare criteri inclusione/esclusione rispondenti Specificare unità di analisi Costruire lista campionamento Identificare variabili chiave e loro eterogeneità Valutare errore Stabilire numerosità campionaria Definire criterio campionamento

Campionamenti non probabilistici (tipici della ricerca non standard) A casaccio Per quote Auto-selezionato Testimoni privilegiati A valanga

Non probabilistici: a casaccio è il cosiddetto campionamento accidentale Es. : mi metto all’angolo di una strada e scelgo il primo caso che capita, senza criteri definiti, ma solo in ragione di praticità e velocità

Non probabilistici: per quote È come uno ovvero definisco delle quote di popolazione in base alle variabili che mi interessano Es: in genere non è proporzionale, ma può riflettere le caratteristiche della popolazione Diplomati Laureati Maschi 50 Femmine

Non probabilistici:autoselezionato …Laddove i casi si selezionano da soli rispondendo alla somministrazione… Esempi: il televoto alcune survey online alcuni questionari di gradimento

Non probabilistici:Testimoni privilegiati Campione di esperti Campione sociologico Si basa essenzialmente sulle caratteristiche predefinite degli individui Tipico dei Delphi o dei Focus group

Non probabilistici: a valanga Scelgo alcuni casi di partenza (possibilmente “idealtipici” o testimoni privilegiati) Chiedo loro di fornirmi altri conoscenti da intervistare con tali caratteristiche Più fasi possibili Rischi di condizionamento sulla base del capitale relazionale delle persone