Campionamento.

Slides:



Advertisements
Presentazioni simili
Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Advertisements

8) GLI INTERVALLI DI CONFIDENZA
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
I TEST DI SIGNIFICATIVITA' IL TEST DI STUDENT
Alcuni aspetti chiave e preliminari:
STATISTICA DESCRITTIVA
Proprietà degli stimatori
La sperimentazione clinica
Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento.
Statistica Descrittiva e Statistica Inferenziale
Campione e campionamento
CAMPIONE E CAMPIONAMENTO
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
STATISTICA A – K (60 ore) Marco Riani
Inferenza statistica per un singolo campione
CAMPIONAMENTO Estratto dal Cap. 5 di:
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
intervallo di confidenza e test di significatività per una proporzione
Innanzitutto divertiamoci
DALL'INTERVALLO DI PROBABILITÀ
Obiettivi del corso di Statistica Medica.
DIFFERENZA TRA LE MEDIE
LE RILEVAZIONI NEL SETTORE AGRICOLO (Loretta Lolli)
Analisi della varianza (a una via)
Appunti di inferenza per farmacisti
Campionamento Capitolo 3.
ALCUNI TERMINI: POPOLAZIONE CAMPIONE CAMPIONAMENTO INFERENZA STATISTICA PARAMETRI (ad es. ) STIMATORI (ad es. x) n: DIMENSIONE DEL CAMPIONE MISURE.
IL CAMPIONAMENTO NELLA REVISIONE CONTABILE
Lezione 6 Inferenza statistica
Il Campionamento nel 2013.
Verifica delle ipotesi su due campioni di osservazioni
Le distribuzioni campionarie
TIPI DI INDAGINI esaminare tutta la popolazione ---> censimento esaminare un campione ---> indagine campionaria o sondaggio o inchiesta (survey)
TRATTAMENTO DEI DATI ANALITICI
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Test parametrici I test studiati nelle lezioni precedenti (test- t, test-z) consentono la verifica di ipotesi relative al valore di specifici parametri.
STATISTICA INFERENZIALE
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Statistica La statistica è
Il campionamento.
Espressione genica External input Endogenous input S2
Si parla di campionamento probabilistico quando le unità sono selezionate con meccanismo casuale e hanno tutte una probabilità nota e non nulla di.
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Un insieme limitato di misure permette di calcolare soltanto i valori di media e deviazione standard del campione, ed s. E’ però possibile valutare.
Strumenti statistici in Excell
IL CAMPIONE.
La pianificazione della produzione dei dati. Costituzione del gruppo di progettazione L’elevato grado di complessità e la multidisciplinarietà richiesta.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Il campionamento.
Istituto di Ricerche Farmacologiche Mario Negri – Milano Simona Barlera Dipartimento di Ricerca cardiovascolare 5 febbraio 2009 Ricerca traslazionale II.
Elaborazione statistica di dati
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Accademia europea dei pazienti sull'innovazione terapeutica Lo scopo e i fondamenti della statistica negli studi clinici.
STATISTICA P IA F ONDAZIONE DI C ULTO E R ELIGIONE C ARD. G. P ANICO Azienda Ospedaliera CORSO DI LAUREA IN INFERMIERISTICA Sr. Margherita Bramato.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Statistica di Base per le Scienze Pediatriche luigi greco D.C.H, M.D., M.Sc.M.C.H., Ph.D. Dipartimento di Pediatria UniFEDERICOII.
Campionamento procedimento attraverso il quale si estrae, da un insieme di unità (popolazione) costituenti l’oggetto delle studio, un numero ridotto di.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Campionamento.
6 Inchiesta Giulio Vidotto Raffaele Cioffi. Indice: 6.1 Come si prepara un questionario 6.2 Come somministrare un questionario 6.3 Campionamento.
Scienze tecniche e psicologiche
Trattamento dei dati sperimentali
Il DEFF Il DEFF (Design EFFect) è l’Effetto del Piano di
Transcript della presentazione:

Campionamento

obiettivi della presentazionee Che cosa è il Campionamento? Perchè utilizziamo i Campioni? Concetto di rappresentatività Metodi di Campionamento Errore di Campionamento Calcolo della dimensione del campione

Definizione di Campionamento Procedura per le quali alcuni membri della popolazione sono selezionati come rappresentativi della intera popolazione

perchè campioniamo le popolazioni? Dare informazioni su grandi popolazioni Al minimo costo A massima rapidità Con maggiore accuratezza Usando strumenti raffinati

Campionamento Precisione Costo

Che cosa si richiede di conoscere Concetti rappresentatività Campionamento : metodi Come scegliere il giusto metodo Calcoli errore di Campionamento effetto del Disegno dimensione del campione

Definizioni e termini del Campionamento Unità di Campionamento unità di base di Campionamento (bsu) intorno alla quale il Campionamento è pianificato Frazione di Campionamento Il rapporto tra la dimensione del campione e la dimensione della popolazione Universo di Campionamento ogni lista di tutte le unità di Campionamento della popolazione Schema di Campionamento metodo di selezione delle unità di Campionamento dall’universo di Campionamento

Campionamento e rappresentatività Popolazione Campionaria campione Popolazione Bersaglio Popolazione Bersaglio  popolazione Campionaria  campione

Concetto di rappresentatività Persone età Sesso altre caratteristiche demografiche Esposizione/suscettibilità Luogo Urbana Rurale Tempo Stagionalità Giorno della settimana Ora del Giorno

Tipo di Campioni Campionamento Non-probabilistico Campioni di Convenienza viziati scenario migliore o peggiore Campioni soggettivi Basati sulla conoscenza Tempo/risorse e vincoli Campionamento probabilistico Il solo metodo di Campionamento che consente di estrarre valide conclusioni circa la popolazione

Campioni probabilistici Campionamento casuale ogni soggetto ha una nota probabilità di essere scelto Riduce la possibilità di vizio di selezione di soggetti consente l’applicazione di teoria statistica ai risultati

errore di Campionamento Nessun campione è una perfetta immagine speculare della popolazione La grandezza di errore può essere misurato in Campioni probabilistici Espressione dell’errore standard di media, di proporzione, di differenze, etc Funzione della … dimensione del campione quantità di variabilità nella misura del fattore di interesse

metodi usati in Campionamento probabilistico Campionamento casuale semplice Campionamento sistematico Campionamento stratificato Campionamento a Cluster Campionamento Multistadio

Campionamento casuale semplice Principio Uguale opportunità per ogni unità statistica di essere estratto Procedura numerare tutte le unità Estrarre unità casuali vantaggi semplice errore di Campionamento facilmente misurato svantaggi richiede la completa lista di unità non sempre ottiene la migliore rappresentatività

Esempio: Campionamento casuale semplice 1 Alberto D. 2 Riccardo D. 3 Bella H. 4 Raimondo L. 5 Stéfania B. 6 Alberto T. 7 Giampaolo V. 8 André D. 9 Daniele C. 10 Antonio Q. 11 Giacomo B. 12 Daniele G. 13 Amanda L. 14 Giovanna L. 15 Filippa K. 16 Eva F. 17 Piera O. 18 Tommaso G. 19 Brian F. 20 Elena H. 21 Isabella R. 22 Gianna T. 23 Samanta D. 24 BerIl L. 25 Monica Q. 26 Régine D. 27 Lucille L. 28 Geremia W. 29 Gilles D. 30 Renaud S. 31 Piero K. 32 Michele R. 33 Marie M. 34 Gaétano Z. 35 Fidèle D. 36 Maria P. 37 Anne-Marie G. 38 Michele K. 39 Gastone C. 40 Aldo M. 41 Olivier P. 42 Ginevra M. 43 BerIl D. 44 Gianna P. 45 46 François P. 47 Domenica M. 48 Antonio C.

( R ): lista di numeri casuali Random Samples and Permutations Description: 'sample' takes a sample of Il specified size da Il elements of 'x' using either con or without replacement. Usage: sample(x, size, replace = FALSE, prob = NULL) Arguments: x: Either a (numeric, complex, character or logical) vector of più than one element da which to choose, or a positive integer. size: non-negative integer giving Il number of items to choose. replace: Should sampling be con replacement? prob: A vector of probability weights per obtaining Il elements of Il vector essere sampled.

(R): lista numeri casuali sample(c(0:3000), 100, replace = TRUE) [1] 2310 2034 1455 688 2290 2809 2914 2014 2875 2165 501 65 1056 271 1858 [16] 1692 1946 509 72 497 2929 966 2190 1560 1384 790 482 2234 269 1322 [31] 333 42 90 1884 1907 699 1141 2677 2757 178 2558 1126 2745 240 738 [46] 2058 669 2171 2302 2659 1421 2416 1861 498 481 2222 1580 2378 2186 2379 [61] 1151 278 1785 63 1651 1140 1876 343 480 2066 2955 1444 2157 1107 1124 [76] 272 626 1768 1417 739 2260 75 1550 406 2085 197 642 191 2887 2506 [91] 2926 997 1383 502 973 2420 1201 1732 2865 1511

Campionamento sistematico Principio unità estratte con una constante intervallo tra successive unità Uguale opportunità per ogni unità di essere estratta Procedura Calcolare l’intervallo di Campionamento (k = N/n) estrarre una lista di numeri casuali ( k) per starting estrarre ogni k unità dalla prima unità Vantaggi Assicura rappresentatività attraverso la lista Facile da implementare Può migliorare la precisione Svantaggi dannoso se la lista ha cicli

Esempio: Campionamento sistematico

Campionamento stratificato Principio Classificare la popolazione in sottogruppi internamente omogenei (strato) estrarre un campione da ogni strato Combinare risultati di tutte le strato Vantaggi Più precise se variabile associated con strato Tutti sottogruppi rappresentati, allowing separate conclusioni circa la ogni di essi Svantaggi errore di Campionamento di difficile misurazione Perdita di precisione se tutti numeri campionati in un singolo strato

Esempio: Campionamento stratificato Determinare la copertura della vaccinazione in una regione Un campione estratto in ogni regione stima calcolata per ogni strato ogni strato pesato per ottenere stima per regione (media)

Campionamento a Cluster Principio campione casuale di gruppi (“clusters”) di unità In cluster selezionati, sono incluse tutte le unità o proporzioni di unità (campione) Campionamento entro cluster può essere semplice casuale o sistematico

Esempio: Campionamento una Cluster Sezione 1 Sezione 2 Sezione 3 Sezione 5 Sezione 4

Campionamento a Cluster vantaggi semplice poichè la lista di Campionamento completa delle unità entro popolazione non è richiesta meno richiesta di viaggi e risorse svantaggi Imprecisa se i clusters non sono omogenei e quindi la variazione tra campioni è maggiore della variazione nella popolazione (grande effetto del disegno) Errore di Campionamento è difficile da misurare

effetto del disegno varianza globale varianza di Cluster Σ (pi-p)² Var clus = ------------- k(k-1) p(1-p) Var ccs = ---------- n effetto del Disegno = --------------- Var ccs Var clust p= proporzione globale pi= proporzione in ogni stratum n= numeri di soggetti k= numero di strati

( R ): Calcolo dell’effetto del disegno

Campionamento Multistadio Principio molteplici Campioni concatenati molteplici unità statistiche vantaggi Non esiste una completa lista di popolazione richiesta Il più facile approccio per grandi popolazioni svantaggi molteplici liste di Campionamento errore di Campionamento difficile da misurare

Esempio: Campionamento Multistadio Determine una suscettibilità all’epatite tra bambini delle scuole di una regione campione di regioni estratte dalla nazione campione di città estratte da ogni regione selezionata campione di scuole estratte in ogni città selezionata campione bambini entro scuole selezionate

selezione una metodo di Campionamento popolazione che deve essere studiata dimensione della distribuzione geografica eterogeneità della variabile livello di precisione richiesta risorse disponibili Importance di avere una precisa stima dell’errore di Campionamento

passi nella stima dimensione del campione Identificare una variabile maggiore dello studio Determine tipo di stima (%, mean, ratio,...) Indicare la frequenza attesa di fattore di interesse Decidere la precisione di stima desiderata Decidere il rischio accettabile che stima cada fuori dal valore dela sua popolazione reale Correggere per la stima d’effetto del disegno Correggere per attesa proporzione di risposta (Correggere per la dimensione della popolazione )

dimensione del campioneformula in descrittiva survey Campionamento casuale semplice / sistematico z² * p * q 1.96²*0.15*0.85 n = -------------- = ---------------------- = 544 d² 0.03² Campionamento a Cluster 2*1.96²*0.15*0.85 z² * p * q n = g* -------------- = ------------------------ = 1088 d² 0.03² z: rischio alfa espresso in z-score p: attesa prevalence q: 1 - p d: absolute precisione g: effetto del disegno

EPITABLE: Calcolo dimensione del campione a cluster

Ruolo del Campionamento in indagine descrittiva Definire obiettivo Definire risorse disponibili Identificare study popolazione Identificare variabiles to study Definire precisione richiesta Stabilire plan di analysis (questionenario) Creare Campionamento estrazione Select campione Pilot data collezione Collect data Analyse data Communicate risultati Use risultati

Conclusioni Campioni probabilistici sono I migliori Fate attenzione ai … Rifiuto di partecipazione Dati mancanti “tutto ciò che non si conosce”

Consultate uno statistico Conclusioni Se avete dei dubbi … Consultate uno statistico