Il campionamento.

Slides:



Advertisements
Presentazioni simili
8) GLI INTERVALLI DI CONFIDENZA
Advertisements

Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Alcuni aspetti chiave e preliminari:
STATISTICA DESCRITTIVA
STATISTICA DESCRITTIVA
Intervalli di confidenza
Proprietà degli stimatori
Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento.
Fondamenti della Misurazione
Statistica Descrittiva e Statistica Inferenziale
Campione e campionamento
CAMPIONE E CAMPIONAMENTO
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Inferenza statistica per un singolo campione
CAMPIONAMENTO Estratto dal Cap. 5 di:
Obiettivi del corso di Statistica Medica.
LE RILEVAZIONI NEL SETTORE AGRICOLO (Loretta Lolli)
Appunti di inferenza per farmacisti
Campionamento Capitolo 3.
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a VARIABILITA’ BIOLOGICA E CASO
IL CAMPIONAMENTO NELLA REVISIONE CONTABILE
Cap. 2 Definizioni e notazione (simboli) di base
Teorie e tecniche di psicologia clinica
Lezione 8 Numerosità del campione
Indagine multiscopo F A S I 1 a FASE: PROGETTAZIONEobiettivi, unità, costi, tempi 2 a FASE: RILEVAZIONEraccolta informazioni tramite questionario 3 a.
Verifica delle ipotesi su due campioni di osservazioni
Lo stimatore per quoziente è asintoticamente corretto
METODI E CONTROLLI STATISTICI DI PROCESSO
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
Le distribuzioni campionarie
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
Statistica Che cos’è?.
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
TIPI DI INDAGINI esaminare tutta la popolazione ---> censimento esaminare un campione ---> indagine campionaria o sondaggio o inchiesta (survey)
CAMPIONAMENTO PER CENTRI
CAMPIONAMENTO DI REVISIONE CONTABILE
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Metodologia della ricerca sociale lorenzo bernardi
STATISTICA INFERENZIALE
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Statistica La statistica è
La statistica.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Si parla di campionamento probabilistico quando le unità sono selezionate con meccanismo casuale e hanno tutte una probabilità nota e non nulla di.
Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –
La verifica d’ipotesi Docente Dott. Nappo Daniela
Corso di Analisi Statistica per le Imprese
Controllo di qualità dei processi e collaudo
IL CAMPIONE.
“Teoria e metodi della ricerca sociale e organizzativa”
Le distribuzioni campionarie
Intervalli di confidenza
Metodologia della Ricerca Sociale
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Il campionamento.
INDICATORI SOCIALI E VALUTATIVI
NB: La lettura delle slide è solo un supporto allo studio che non sostituisce i testi di esame Metodi e tecniche della ricerca sociale - Prof. Flavio Ceravolo.
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Accademia europea dei pazienti sull'innovazione terapeutica Lo scopo e i fondamenti della statistica negli studi clinici.
STATISTICA P IA F ONDAZIONE DI C ULTO E R ELIGIONE C ARD. G. P ANICO Azienda Ospedaliera CORSO DI LAUREA IN INFERMIERISTICA Sr. Margherita Bramato.
Corso di Statistica Applicata C. L. in Tecnologie forestali e ambientali 4 crediti (32 ore) Docente: Lorenzo Marini DAFNAE, Università di Padova
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
Campionamento procedimento attraverso il quale si estrae, da un insieme di unità (popolazione) costituenti l’oggetto delle studio, un numero ridotto di.
6 Inchiesta Giulio Vidotto Raffaele Cioffi. Indice: 6.1 Come si prepara un questionario 6.2 Come somministrare un questionario 6.3 Campionamento.
Il DEFF Il DEFF (Design EFFect) è l’Effetto del Piano di
Transcript della presentazione:

Il campionamento

CAMPIONAMENTO È il procedimento logico in base al quale l’insieme delle procedure per la costruzione del campione si salda alla teoria della stima e della verifica delle ipotesi. DISEGNO DI CAMPIONAMENTO È l’insieme delle regole seguite per la costruzione del campione.

Struttura del campione: insieme delle liste che si utilizzano per costruire il campione. La lista comprende l’elenco di tutte le unità che compongono l’universo. Se la struttura del campione è semplice: una lista. Se la struttura del campione è complessa: più liste.

La popolazione è intesa come aggregato di unità statistiche. Le caratteristiche e le proprietà della popolazione che si intendono studiare sono definite variabili o caratteri. Possiamo ottenere le informazioni sulle variabili attraverso due metodi: Rilevazione totale o censuaria (si analizzano tutte le unità che compongono l’universo) Rilevazione campionaria (studio per inferenza dell’universo)

Definizioni di base Popolazione o universo: ogni insieme finito o infinito di unità (non necessariamente esseri umani). La numerosità si indica con N Campione: insieme delle n (unità campionarie) selezionate tra le N che compongono la popolazione, detta popolazione di riferimento

Statistica descrittiva: è l’insieme delle procedure utili per organizzare i dati raccolti in forma conveniente e comunicabile Statistica inferenziale:è l’insieme delle procedure atte a raggiungere conclusioni più ampie rispetto ai valori raccolti, tali da poter essere messi in relazione con l’universo.

Vogliamo studiare le variabili (proprietà) X, Y, Z, di un certo campione. Studiarle significa conoscere alcuni valori caratteristici assunti dall’intera popolazione (cioè la loro DISTRIBUZIONE) o le relazioni fra le variabili stesse. Chiamiamo queste conoscenze PARAMETRI

Esempi: se l’unità è l’individuo e la variabile X è il reddito e vogliamo conoscere il reddito medio, il parametro della popolazione che vogliamo conoscere è la MEDIA Se la variabile Y è il voto e noi vogliamo conoscere la proporzione di persone che hanno votato il partito A, il parametro della popolazione che vogliamo conoscere è una PROPORZIONE

Se vogliamo studiare la relazione fra le variabili X e Z, il parametro che vogliamo conoscere è un coefficiente di CORRELAZIONE

Se conoscessimo la popolazione totale, avremmo il valore esatto del parametro che stiamo studiando, ma questa è un’ipotesi che non si verifica mai (se non nei casi di censimento) L’indagine campionaria ci fornisce una STIMA, un valore approssimato

V = v ± e È sempre presente un ERRORE nelle stime che calcoliamo Parametro della popolazione (incognito) Stima del campione Errore di campionamento

Quindi, se effettuiamo una rilevazione totale sul reddito degli italiani, possiamo dire: “il reddito medio degli italiani è € 1.350”. Se effettuiamo un rilevazione campionaria, diciamo: “c’è il 95% di probabilità che il reddito medio degli italiani sia di € 1.300 ± 50”

Nel secondo caso, il ricercatore non è certo del suo calcolo, c’è un 5% di probabilità che il reddito sia al di fuori dei valori indicati. Il ricercatore calcola un intervallo di fiducia nel quale si colloca il valore della statistica della popolazione. La stima del campione è sempre affetta da un ERRORE DI CAMPIONAMENTO.

Determinazione della NUMEROSITÀ OTTIMALE del campione: È la numerosità che permette alle stime che compiamo di raggiungere il livello di attendibilità che ci attendiamo.

5% 2% 1% N n 100 80 96 99 300 170 270 296 500 220 415 475 1.000 285 715 910 5.000 370 1.660 3.330 > 8.000 400 > 50.000 2.500 > 200.000 10.000

Vantaggi del campionamento: Riduzione dei costi Rapidità Scopi specifici Accuratezza

3 concetti correlati al tema del campionamento: Eterogeneità: presenza di caratteristiche e qualità diverse nel campione, collegate alla variabilità degli atteggiamenti e dei comportamenti Rappresentatività: si dice rappresentativo un campione che presenta alcune caratteristiche dell’universo in proporzioni analoghe 3. Sufficienza: misura l’attendibilità dei dati, ovvero la probabilità che essi siano validi per l’universo entro certi termini statisticamente determinabili

Regole seguite per identificare le unità da inserire nel campione come si seleziona ogni singolo caso? Criterio costante: uguale per tutte le unità della lista Criterio variabile: se ad ogni unità viene assegnata una probabilità di selezione propria

Che cosa è possibile ottenere dai dati raccolti? Verifica delle ipotesi di contenuto (cioè le ipotesi di rapporti tra le variabili): si rimane nell’ambito dei risultati disponibili e tale verifica è valida soltanto per le unità di analisi considerate. valido per campioni NON PROBABILISTICI Inferenze: si generalizzano i risultati dal campione all’universo valido per campioni PROBABILISTICI

CAMPIONI PROBABILISTICI Campioni casuali o probabilistici: sono regolati dalla legge del CASO, cioè della probabilità Si attribuisce ad ogni unità della popolazione una probabilità positiva di essere selezionata Si utilizzano tecniche per la selezione casuale del campione

La probabilità di selezionare i casi è nota Per costruire un campione probabilistico è indispensabile la conoscenza dell’universo; devono essere note e disponibili le fonti (es. lista completa della popolazione) Le fonti possono anche definire universi “settoriali”

Si possono costruire diversi tipi di campioni probabilistici a seconda del metodo di estrazione

Campione casuale semplice/sistematico Può essere estratto per sorteggio o per intervallo fisso (scegliendo un nominativo ogni tot da una lista e prevedendo eventuali sostituti), fino a raggiungere la numerosità desiderata. Il rapporto tra la numerosità dell’universo e quella del campione dà la misura dell’intervallo fisso da rispettare. È opportuno su popolazioni relativamente piccole, in un’area ristretta, dove si può disporre di liste complete.

Se non abbiamo liste della popolazione N, possiamo costruire un campione sistematico? Sì, in alcuni casi, ad es.: exit polls, ricerche di mercato Regola: tutte le unità devono avere la stessa probabilità di essere incluse nel campione, quindi l’estrazione deve coinvolgere tutta la popolazione e non solo una parte. Es. tutti i clienti di un negozio: la rilevazione deve durare per tutto l’orario di apertura

2. Campione stratificato La popolazione viene suddivisa in STRATI. Si mantiene l’estrazione casuale, ma si utilizzano una o più variabili stratificanti, tali da controllare meglio la rappresentatività dei casi selezionati. Es.: per il reddito, si suddivide la popolazione per la professione svolta

Il campione può essere proporzionale o non proporzionale. Il campione si dice stratificato proporzionale se riproduce la stessa composizione degli strati della popolazione Es. se operai, impiegati, lav.autonomi e professionisti sono rispettiv. il 35, 40, 15 e 10% della popolazione, costruiremo un campione di 1000 casi composto da 350 operai, 400 impiegati, ecc…

Invece, se sovra o sotto-rappresentiamo alcuni strati, otteniamo un campione stratificato non proporzionale. In questo caso, dovremo effettuare un’operazione di ponderazione.

3. Campione a stadi Si utilizza ad es. quando manca la lista completa delle unità della popolazione. Viene definito sulla base di scelte e procedure successive, che passano per più stadi o fasi. Si individuano diverse unità (primarie, secondarie…) e si procede con estrazioni successive

Es. ricerca sui medici di medicina generale Unità primaria: Ausl locale cui afferisce il medico Unità secondarie: i medici stessi Il campionamento si effettua in due stadi, cioè in due estrazioni successive. Primo: si estrae un campione di unità primarie (ad es. 100 aziende Ausl) Secondo: si estrae casualmente un numero di unità secondarie, cioè un numero di medici

4. Campioni a grappolo Si utilizza quando la popolazione è naturalmente suddivisa in gruppi di unità contigue Ad es. le famiglie, le classi scolastiche, i ricoverati in ospedale, ecc. Campione a stadi e a grappolo si possono combinare: Es. Indagine multiscopo dell’Istat sulle famiglie (a stadi: campione di comuni; a grappolo: campione di famiglie)

CAMPIONI NON PROBABILISTICI Seguono l’orientamento di chi li costruisce; vengono costruiti senza conoscere la probabilità di estrazione dei casi. Viene a mancare la conoscenza dell’universo L’inferenza non si può applicare I risultati sono validi solo per il campione

Campione di convenienza Basato su criteri di comodità Selezione non casuale Probabili errori sistematici Crea un campione non rappresentativo Si reclutano preferenzialmente unità "particolari" rispetto alla popolazione. Un campione così ottenuto è soggetto a distorsione (bias) che, essendo appunto dovuto al metodo di selezione, viene detto bias di selezione. Ovviamente un campione di questo tipo fornisce dati poco affidabili e pregiudica il processo di generalizzazione dei risultati

Campione “a casaccio”: costruito in modo accidentale, senza regole A scelta ragionata: le unità sono scelte in modo da avvicinarsi nell’insieme alle caratteristiche della popolazione Di unità tipiche: formati da unità tratte da gruppi omogenei per caratteristiche predefinite

Per quote: l’intervistatore sceglie le unità da intervistare, ma deve rispettare le quote di popolazione che rappresentano determinate caratteristiche A palla di neve (a valanga)

Campioni probabilistici Campioni non probabilistici Semplicità No Sì Rapidità Economicità Ipotesi di contenuto Analisi dell’universo Rappresentatività Inferenza