Sondages Corso di campionamento Sandro Squarcia Statistica Matematica e Trattamento Informatico dei Dati (SMID) IUT Nice – Côte dAzur Département STID.

Slides:



Advertisements
Presentazioni simili
Introduzione alla statistica
Advertisements

Monitoraggio e valutazione dei servizi formativi
8) GLI INTERVALLI DI CONFIDENZA
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Claudio Formenti Ufficio Statistica Comune di Como
Alcuni aspetti chiave e preliminari:
STATISTICA DESCRITTIVA
STATISTICA DESCRITTIVA
Intervalli di confidenza
Proprietà degli stimatori
Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento.
La divulgazione della statistica
DISEGNO DI UNO STUDIO EPIDEMIOLOGICO
2 Marketing La ricerca di marketing J. Paul Peter
Statistica Descrittiva e Statistica Inferenziale
Campione e campionamento
CAMPIONE E CAMPIONAMENTO
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Percorso introduttivo alla statistica ufficiale L’INDAGINE STATISTICA
La piattaforma di BI si basa essenzialmente su un sistema di metadati centralizzato che garantisce la consistenza delle informazioni e consente la navigazione.
Estratto dal Cap. 3 di: Statistics for Marketing and Consumer Research, M. Mazzocchi, ed. SAGE, LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi.
CAMPIONAMENTO Estratto dal Cap. 5 di:
LE RILEVAZIONI NEL SETTORE AGRICOLO (Loretta Lolli)
Analisi della varianza (a una via)
Appunti di inferenza per farmacisti
Campionamento Capitolo 3.
Metodi della ricerca in Psicologia
CORSO DI MODELLI DI SISTEMI BIOLOGICI LAUREA IN INGEGNERIA CLINICA E BIOMEDICA.
IL CAMPIONAMENTO NELLA REVISIONE CONTABILE
Cap. 2 Definizioni e notazione (simboli) di base
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Modello E-R Generalizzazioni
Parte I (introduzione) Taratura degli strumenti (cfr: UNI 4546) Si parla di taratura in regime statico se lo strumento verrà utilizzato soltanto per misurare.
Indagine multiscopo F A S I 1 a FASE: PROGETTAZIONEobiettivi, unità, costi, tempi 2 a FASE: RILEVAZIONEraccolta informazioni tramite questionario 3 a.
Cai Lin Lin Michela & Guidetti Emanuela presentano:
Lo stimatore per quoziente è asintoticamente corretto
TECNICHE DI CAMPIONAMENTO DI POPOLAZIONI RARE O IN MANCANZA DI LISTE
Le distribuzioni campionarie
Statistica Che cos’è?.
TIPI DI INDAGINI esaminare tutta la popolazione ---> censimento esaminare un campione ---> indagine campionaria o sondaggio o inchiesta (survey)
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
STATISTICA INFERENZIALE
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Statistica La statistica è
Il campionamento.
La statistica.
Si parla di campionamento probabilistico quando le unità sono selezionate con meccanismo casuale e hanno tutte una probabilità nota e non nulla di.
Psicologia come scienza:
Un insieme limitato di misure permette di calcolare soltanto i valori di media e deviazione standard del campione, ed s. E’ però possibile valutare.
Controllo di qualità dei processi e collaudo
IL CAMPIONE.
La pianificazione della produzione dei dati. Costituzione del gruppo di progettazione L’elevato grado di complessità e la multidisciplinarietà richiesta.
ORIENTAMENTO CONSAPEVOLE
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Certificazione bilancio/121 Statistica e revisione contabile Scopi della certificazione di bilancio Scopi e modalità dell’analisi statistica Esempio.
Il campionamento.
Disegno d’indagine Nella fase di definizione del disegno di indagine si individuano le modalità di rilevazione che soddisfano esigenze conoscitive su:
Studio fenomeni collettivi
STATISTICA P IA F ONDAZIONE DI C ULTO E R ELIGIONE C ARD. G. P ANICO Azienda Ospedaliera CORSO DI LAUREA IN INFERMIERISTICA Sr. Margherita Bramato.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
Campionamento procedimento attraverso il quale si estrae, da un insieme di unità (popolazione) costituenti l’oggetto delle studio, un numero ridotto di.
4. Controllo Giulio Vidotto Raffaele Cioffi. Indice: 4.1 Strategie generali 4.2 Strategie specifiche 4.3 Ripetizione 4.4 Metodi per aumentare la validità.
6 Inchiesta Giulio Vidotto Raffaele Cioffi. Indice: 6.1 Come si prepara un questionario 6.2 Come somministrare un questionario 6.3 Campionamento.
Il DEFF Il DEFF (Design EFFect) è l’Effetto del Piano di
Transcript della presentazione:

Sondages Corso di campionamento Sandro Squarcia Statistica Matematica e Trattamento Informatico dei Dati (SMID) IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Dipartimento di Fisica Università degli Studi di Genova Via Dodecaneso 33, Genova

Scopo del corso Familiarizzarsi con la terminologia e i diversi tipi di campionamento Costruire un piano di campionamento Stimare i parametri di una popolazione a partire dai risultati di un campionamento Valutare gli errori del campionamento Determinare i livelli di attendibilità che a partire dal sondaggio effettuato si possono attribuire alla popolazione in esame

Indagine statistica Ogni indagine statistica può essere realizzata tramite due differenti rilevazioni: rilevazione censuaria o totale ossia realizzata studiando completamente il fenomeno in oggetto (censimento) rilevazione campionaria o parziale osservando solo una parte della totalità (sample survey) In questo corso ci occuperemo solo dellindagine campionaria trattando il campionamento da popolazioni finite

Rilevazione censuaria Per indagine totale si intende una rilevazione di tutte le unità (universo o popolazione target) che presentano le caratteristiche che si intendono studiare Ne sono esempi i censimenti e le indagini in cui la popolazione target è costituita da poche unità molto importanti (perché caratteristiche) Si ottengono misure esatte, ma con alti costi di rilevazione e trattamento dei dati e con possibile incompletezza dovuta allincapacità materiale di raggiungere tutte le singole unità

Premessa storica Fin dai secoli XVII e XVIII si trovano studi e analisi che si fondano su rilevazioni parziali: Laplace nel 1802 stimò la popolazione della Francia tramite censimento in 30 dipartimenti Marx (1880) inviò un questionario a operai francesi per studiare il fenomeno delle sfruttamento da parte dei datori di lavoro I sondaggi di opinione sono diffusi negli USA già dal 1834 per prevedere i risultati delle elezioni presidenziali

Situazione attuale Dallinizio del 1900 si è cercato di stabilire la validità delle indagini campionarie arrivando a creare una vera e propria teoria dei campioni, basata su solide fondamenta matematiche Le tecniche di campionamento sono una delle tematiche più importanti della statistica applicata …e la loro conoscenza è diventata essenziale di fronte alla sempre maggior richiesta di sondaggi di opinione e indagini di mercato richiesti quotidianamente dai mezzi di comunicazione

Indagini campionarie Alla luce di questi problemi si ricorre spesso alle indagini campionarie anche se questo implica minor precisione Notevole risparmio di mezzi, e più in generale un minor impiego di risorse materiali e umane accrescere il numero delle indagini abbreviare la cadenza di quelle periodiche maggiore tempestività (importante se si vuole avere il polso del mercato o della situazione)

Campionamento Si definisce campionamento il procedimento attraverso cui: dallinsieme di unità costituenti loggetto dello studio si estrae un numero ridotto di casi scelti con criteri tali da consentire la generalizzazione dei risultati allintera popolazione Risulta necessario che il campione rappresenti correttamente ed efficientemente luniverso: le statistiche devono essere una buona stima dei parametri della popolazione di riferimento

Sondaggio POPOLAZIONE: finita (N) o infinita Tecniche campionarie CAMPIONE (n osservazioni) Rilevamento ed elaborazione dei dati Stime campionarie (media m e deviazione standard s) INFERENZA STATISTICA Parametri della popolazione (media e deviazione standard ) Valore vero valore atteso = m ± (s / n)

Le fasi della ricerca La ricerca si articola in diverse fasi, nelle quali si evidenziano: i compiti, le responsabilità, i tempi i costi di ogni singola operazione Le fasi caratteristiche sono sette: Una preliminare di progettazione Tre di raccolta dei dati Due di analisi dei dati Una di comunicazione

1: Progettazione Consiste nel definire: gli obiettivi dello studio, la popolazione a cui si vuol fare riferimento, i costi e i tempi dello studio, la definizione del piano di campionamento, le caratteristiche del questionario o della indagine che si intende utilizzare, (questa parte sarà un particolare loggetto di questo corso) …. tutto quanto sarà necessario per la buona riuscita dello studio

2: Rilevazione dei dati Nella prima fase della raccolta dei dati sono specificate le modalità di rilevazione dei dati La presa dei dati può avvenire tramite: questionari, che possono essere: cartacei informatici intervistatori, che agiscono in via diretta: contatto personale inchiesta telefonica inchiesta via mediante internet ….

3: Registrazione La seconda fase della raccolta dei dati è la registrazione che consiste nel trasferimento dei dati stessi su un supporto magnetico, in modo che siano elaborabili Questa fase è importantissima e strettamente legata alla precedente e alla successiva Se il questionario è libero sarà molto difficile incasellare correttamente i dati Se il questionario è troppo vincolante si rischia di perdere informazioni importanti che saranno riportate in modo scorretto

4: Revisione e codifica La terza fase della raccolta dei dati è la revisione ossia: il controllo di adeguatezza dei dati ovvero la validazione dei dati raccolti la codifica dei dati stessi (in questo punto risulta evidente se vi sono stati degli errori di registrazione nella fase precedente la scelta e la messa a punto delle procedure di elaborazione (software specializzati o creati dal ricercatore) che dipendono fortemente da come i dati stessi sono stati codificati

5: Elaborazione dei dati La prima fase dellanalisi dei dati è lelaborazione statistica propriamente detta Mediante lutilizzo di pacchetti statistici (EXCEL, SAS, SPSS, STATA….) vengono prodotti tabelle e rapporti statistici Questi rappresentano lestrapolazione dei parametri della popolazione che si intende esaminare sulla base del campione statistico su cui si è effettuata lanalisi I risultati offriranno una forchetta entro cui, statisticamente parlando, risiede la verità

6: Validazione dei dati La seconda fase dellanalisi dei dati è la validazione ossia lanalisi della coerenza dei risultati ottenuti dai dati che sono stati raccolti ed elaborati Questa fase è alquanto difficile perché occorre ipotizzare quali sono i risultati attesi Solo con molta esperienza si può determinare se i risultati ottenuti dal campione siano realmente rappresentativi della popolazione di cui si vuole determinare i parametri (ad esempio sondaggio del seggio particolarmente significativo sullorientamento degli elettori)

7: Diffusione dei risultati In questa fase, dove possono essere necessari esperti in scienza della comunicazione, i risultati elaborati sono resi disponibili al pubblico, corredati degli opportuni commenti Ad esempio se si calcola il Risk Ratio per il cancro al cervello da radiazioni non ionizzanti di telefoni cellulari sulla base delle pubblicazioni degli ultimi 20 anni si ottiene un valore di circa 1 Ma considerando una ricerca dal 1990 al 2000 in Danimarca si ottiene 0.8 Il telefono cellulare fa dunque bene a chi lo utilizza??

Tasso di non risposta Importante perché può invalidare lo studio: T 10% : livello ottimale perché si dovrebbero ottenere dati certi 10 < T 25%: fornisce buoni risultati ma il ricercatore deve condurre dei controlli aggiuntivi sulla rappresentatività del campione rispondente 25 < T 40%: i controlli supplementari devono essere fatti in modo vasto e accurato: se il piano di campionamento è corretto si procede con lanalisi T > 40%: lindagine dovrebbe essere ripetuta Purtroppo in molti casi T>40%!

Tipi di campionamento Vi sono vari tipi di campionamento, che si differenziano sostanzialmente in due categorie: Campionamenti probabilistici Si utilizza la statistica inferenziale (stimatori ed intervalli di confidenza) che forniscono informazioni sulla popolazione completa Campionamenti non probabilistici La scelta degli elementi della popolazione viene effettuata in base a criteri logici fissati a priori In questi casi è consentito esclusivamente descrivere il risultato campionario con gli opportuni strumenti della statistica descrittiva

Campionamento non probabilistico Campionamento per scelta ragionata: si identificano le zone dove si trova il maggior interesse per il fenomeno in studio (ricerca di un prodotto di moda) Campionamento per quote: si definisce la percentuale di interviste con persone aventi determinate caratteristiche (fumatori-sesso) Campionamento tramite testimoni privilegiati: si intervistano esclusivamente persone esperte del fenomeno in studio (doppio lavoro) Non si può utilizzare la statistica inferenziale per ricavare informazioni sulla popolazione!!!

Campionamento probabilistico In questi tipi di campionamento le unità della popolazione hanno prefissate probabilità di essere incluse nel campione: casuale semplice con ripetizione (bernoulliano) casuale semplice senza ripetizione stratificato (proporzionale, uniforme, ottimale) a grappoli sistematico a più stadi ripetuti (panel e panel ruotati) areale a probabilità variabile

I più utilizzati 1/2 Campionamento casuale semplice (CCS) estrazione (con o senza ripetizione) delle unità del campione con la stessa probabilità Campionamento stratificato costruzione di strati il più possibile omogenei al loro interno ed eterogenei tra loro, poi CCS Campionamento a grappoli suddivisione in sottogruppi (grappoli), CCS tra essi e rilevazioni degli elementi del grappolo Campionamento sistematico scelta casuale della prima unità del campione, poi utilizzo di un passo costante k = N / n

I più utilizzati 2/2 Campionamento a due o più stadi suddivisione della popolazione in sottoinsiemi (I stadio), CCS sui sottoinsiemi, CCS delle osservazioni (II stadio) dai sottoinsiemi Campionamento panel contatto di unità statistiche permanenti a successivi intervalli periodici di tempo per studiare le dinamiche del fenomeno Campionamento panel ruotato contatto continuativo con sostituzione a rotazione delle unità statistiche sotto esame per studiare i flussi e le transizioni (cambio di stato)