La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Scopi del campionamento

Presentazioni simili


Presentazione sul tema: "Scopi del campionamento"— Transcript della presentazione:

1 Scopi del campionamento
OBIETTIVI: - specificare i motivi che inducono (od obbligano) ad esa- minare un campione piuttosto che la popolazione in toto - individuare i principali obiettivi di un campionamento

2 Indipendentemente dagli obiettivi, raramente in uno studio epidemiologico è possibile esaminare ogni singolo individuo dell'intera popolazione. Infatti spesso si è limitati dalle risorse disponibili (economiche, di personale, di laboratori ecc.); in altre occasioni, anche sup-ponendo di disporre di risorse illimitate, l'intera popolazione non è fisicamente raggiungibile o addirittura non è del tutto nota . Si pensi per esempio ad un'indagine epidemiologica da effet-tuare su animali selvatici di una certa specie (es. camosci) in un parco: probabilmente non sarà conosciuto con esattezza il numero degli individui presenti, né il rapporto maschi/femmine né la distribuzione per età ecc..

3 continua In altri casi, il numero di individui che compongono la popolazione da studiare è talmente elevato che lo studio di ognuno di essi è fattibile solo teoricamente. Si pensi ad esempio alle api di un alveare o ai pesci presenti un laghetto di allevamento. Infine, è possibile trovarsi di fronte ad una combinazione delle suddette difficoltà, come ad esempio nel caso si volessero studiare gli insetti vettori di una determinata malattia in una determinata zona. Talvolta, soprattutto nel lavoro di ricerca medica, la popolazione è addirittura infinita o, meglio, indeterminata in quanto non è conoscibile in modo esaustivo, neppure virtualmente

4 Esempio : Una popolazione indeterminata è rappresentata da tutti gli individui che, oggi e in futuro, necessiteranno di una particolare terapia, oppure dall'insieme delle concentrazioni di una sostanza misurabili in tempi diversi nel sangue). Non sempre per popolazione si intende un aggregato di individui; talvolta si può lavorare su una popolazione di batteri, o di virus, o di cellule in coltura, o di campioni di latte ecc. Anche in questi casi è evidente che sarà spesso impossibile esaminare l'intera popolazione.

5 Il campione è una parte del tutto
L'esame di un campione L'esame di un campione, ossia di un numero ridotto di osser-vazioni, invece dell'intera popolazione consente di superare i problemi ora accennati. Un campione non è altro che un insieme di elementi tratti da una popolazione (o "universo"). Un universo consiste della to-talità degli elementi che hanno certe caratteristiche. Il campione è una parte del tutto Scegliere un campione da una popolazione significa effettuare un «campionamento». Esaminare ogni singolo individuo della popolazione significa effettuare un censimento; esaminare gli individui di un campione significa effettuare una indagine (o inchiesta o sondaggio, in inglese «survey»).

6 uno studio per mezzo di un campione
Quando si effettua uno studio per mezzo di un campione, è necessario tener presente che non si otterranno mai risultati del tutto affidabili. Come si vedrà in seguito, per valutare la "bontà" di uno studio campionario è indispensabile tener conto di vari fattori, fra i quali i più importanti sono: i criteri di scelta della popolazione in studio, il metodo con cui si è selezionato il campione, il periodo di osservazione, i metodi adottati per identificare i casi di malattia, le tecniche di analisi, la precisione delle misure effettuate.

7 Il principale obiettivo di un campionamento è quello di raccogliere dati che con- sentiranno di generalizzare, con un certo grado di certezza, all'intera popolazione le conclusioni ottenute dal campione (una parte del fenomeno). Questo processo di generalizzazione è detto «inferenza».

8 ESEMPIO. Un farmacologo somministra un farmaco a 30 individui con una certa malattia, e del placebo ad altri 30 individui (i «controlli»), ed osserva che dopo una settimana il 25% degli individui trattati con il farmaco sono guariti, mentre tra i controlli trattati con il placebo le guarigioni hanno riguardato il 19% degli individui. Questo risultato non implica necessariamente che il farmaco sia efficace, in quanto lo stesso esperimento condotto su altri 60 individui potrebbe portare a risultati leggermente diversi. Le ipotesi sono due: il farmaco funziona oppure il farmaco non funziona. Attraverso un processo di inferenza (statistica inferenziale) si può giudicare l'efficiacia del farmaco sulla popolazione in generale, e non solo sulla differenza osservata nel campione di 60 pazienti.

9 Caratteri del campione
OBIETTIVO: analizzare i caratteri del campione e spiegare perché non esiste il «campione perfetto»

10 Immaginiamo di aver effettuato una indagine esaminando ciascuna unità che componeva il campione
A questo punto, analizzando i dati forniti dal campione, al fine di trarne delle conclusioni si pongono due domande fondamentali: (1) le conclusioni sono corrette per gli individui che compongono il campione? (2) se sì, il campione rappresenta bene la popolazione da cui è stato estratto? La risposta a queste due domande deriva dai concetti di validità interna e di validità esterna di uno studio epidemiologico.

11 validità interna La validità interna misura quanto i risultati di uno studio sono corretti per il campione di individui che sono stati studiati. Essa viene detta «interna» perché si applica alle condizio-ni del particolare gruppo di individui studiati, e non neces-sariamente a gli altri. Negli studi clinici, la validità interna dipende dalla corret-tezza di impostazione dello studio stesso, dalla scelta di buone tecniche diagnostiche e da un loro corretto utilizzo, da una buona elaborazione dei dati ecc. Nel caso di dati ottenuti attraverso questionari, un fattore che contribuisce ad abbassare la validità interna è rappre-sentato dalla propensione degli intervistati a mentire siste-maticamente su determinate domande

12 ESEMPIO. Un sondaggio per conoscere la percentuale di cani che vengono sottoposti a vaccinazione periodica nei confronti della leptospirosi viene effettuato sottoponendo ai proprietari di cani la seguente domanda: "Lei fa vaccinare annualmente il suo cane per la leptospirosi?". Prevedibilmente i proprietari che hanno cura del loro cane (e che lo vaccinano regolarmente) saranno ben felici di rivelare il loro comportamento e quindi risponderanno correttamente con un "sì". Al contrario, molti di coloro che omettono di vaccinare il cane non saranno disposti ad ammetterlo, per non apparire egoisti o avari, e quindi tenderanno a mentire, rispondendo anch'essi con un "sì". Ciò evidentemente farà diminuire la validità interna del campione.

13 continua La validità interna viene diminuita sia dalla variazione casuale che da ogni elemento di bias. La validità interna è condizione necessaria ma non suf-ficiente perché uno studio sia utile. La validità esterna è il grado di «generalizzabilità» delle conclusioni tratte da uno studio. Ad esempio, nel caso di uno studio epidemiologico clinico, essa risponde alla domanda "Supponendo che i risultati dello studio siano veri, essi si applicano anche ai miei pazienti?". In altre parole, la validità esterna misura il grado di verità dell'assunto secondo cui gli individui studiati sono "uguali" ad altri individui affetti dalla stessa condizione.

14 ottima validità interna
La situazione è riassunta nello schema seguente. Per semplicità, assumiamo ora che lo studio sia provvisto di ottima validità interna; ciò significa che conosciamo con esattezza le caratteristiche del campione che abbiamo esaminato.

15 In presenza di validità interna
Le conclusioni che ne abbiamo tratto sono certamente valide per gli individui del campione, ma non possiamo dire se e quanto tali conclusioni siano generalizzabili alla popolazione da cui il campione è stato estratto. La soluzione a questo problema verrà accennata nelle unità successive ( metodi di campionamento, limiti fiduciali, ecc.). Per ora bastano due considerazioni intuitive: attraverso lo studio di un campione, si può soltanto stimare (cioè determinare con un certo margine di errore) il carattere della popolazione da cui il campione deriva; tuttavia, tale carattere non potrà mai essere determinato con esattezza; la accuratezza della stima è direttamente correlata al numero di osservazioni che si compiono del fenomeno in studio.

16 ESEMPIO 1. Vogliamo conoscere il peso di un lotto di 6000 blister. Non abbiamo la possibilità di pesare tutti i 6000 blister; quindi, estraiamo un campione di 6 elementi, li pesiamo e calcoliamo la media. È evidente che, con questo metodo, avremo un valore che si potrà scostare anche di parecchi grammi dalla media della 'popolazione' da cui essi provengono (cioè il lotto di 6000). Ma se misuriamo altri blister e li aggiungiamo ai primi, la nuova media ottenuta sarà più vicina a quella vera; cioè, la precisione della nostra misura aumenterà parallelamente all'aumento del numero di blister pesati. Tuttavia, non otterremo una misura perfetta finché non avremo pesato tutti i blister.

17 ESEMPIO 2. Abbiamo il compito di effettuare un’indagine sui rapporti fra mastite della bovina e produzione di latte. Nel territorio sono presenti, in pianura, 14 grandi allevamenti, per un totale di 2900 bovine adulte da latte; nella zona monta-gnosa, vi sono invece 36 piccoli allevamenti (300 individui in totale). La popolazione di interesse è: tutte le bovine da latte. L' unità di analisi è la singola bovina da latte. Le nostre risorse ci consentono di esaminare un campione di 300 individui. Se tutti gli individui verranno selezionati dagli allevamenti della pianura, avremo un campione non rappresentativo. Un campione più rappresentativo sarà invece rappresentato dal 90% circa di bovine degli allevamenti di pianura e dal 10% di vacche di montagna.

18 stime In sostanza, con qualunque metodo si effettui il campionamento, si otterranno dal campione dei risultati che quasi certamente si discostano (poco o tanto) dalla «vera» misura della popolazione. È ben vero che il campione dovrebbe rappresentare una immagine della popolazione ridotta dal punto di vista numerico ma fedele dal punto di vista qualitativo. Tuttavia, non possiamo mai essere sicuri che il campione rappresenti una copia perfetta della popolazione da cui esso è stato estratto, a meno di non esaminare... l'intera popolazione!

19 perfettamente rappresentativo?
Infatti, posto [n=numero di individui che compongono una popolazione], supponiamo di analizzare il più ampio campione possibile costituito da [n-1] individui. Ebbene, è intuitivo che, anche in questo caso, il campione non sarà perfettamente rappresentativo della popolazione, in quanto l'unico individuo non esaminato potrebbe possedere caratteri molto diversi da quelli di tutti gli altri [n-1] individui.

20 L'errore di campionamento
L'errore di campionamento è rappresentato dalla differenza tra i risultati ottenuti dal campione e la vera caratteristica della popolazione che vogliamo stimare. L'errore di campionamento non può mai essere determi-nato con esattezza, in quanto la «vera» caratteristica della popolazione è (e resterà!) ignota. Esso tuttavia può essere contenuto entro limiti più o meno ristretti adottando appropriati metodi di campiona-mento. Inoltre, esso può essere stimato; ciò significa che, con adatti metodi statistici, si possono determinare i limiti probabili della sua entità.

21 Errore di campionamento
In sostanza, i fattori responsabili della generazione di un errore di campionamento sono riconducibili a (1) variazione casuale (2) selezione viziata

22 fattori che contribuiscono all'errore di campionamento
La variazione casuale è dovuta al caso, cioè a quel «insieme di fattori o cause, piccole o grandi, che agiscono su un fenomeno senza che noi possiamo o vogliamo controllarli esattamente e prevederne quindi l'azione» (Cavalli-Sforza). La variazione casuale ha portato alla nostra osservazione gli individui che costituiscono il campione, nei quali la misura che vogliamo studiare assume un valore più alto o più basso, senza una regola precisa. La variazione casuale fa sì che una misura effettuata su un campione non fornisca un valore identico alla misura effettuata sulla popolazione: ci potrebbe essere - ed in effetti c'è sempre - un certo errore, che viene detto errore campionario.

23 L'EFFETTO DEL CASO. L'errore campionario deriva semplicemente dal fatto che stiamo osservando soltanto una parte della popolazione. Tutti noi ricorriamo al "caso" per giustificare, ad esempio, il motivo per cui su 100 lanci di una stessa moneta non sempre esce per 50 volte 'testa' e per le restanti 50 'croce'. Questo stesso motivo (la variazione casuale) vale a giustificare il seguente esempio. Supponiamo di avere a disposizione 2 farmaci, A e B, ugualmen-te efficaci, nel senso che guariscono il 50% dei pazienti trattati. Supponiamo di fare un esperimento per studiare l'effetto dei due farmaci; supponiamo che, in questo esperimento, non sia pre-sente alcun bias, e quindi che i dati ottenuti siano assolutamente affidabili. Tuttavia, se l'esperimento prevede di esaminare un numero limi-tato di soggetti per ciascuno dei due trattamenti, facilmente os-serveremo che il farmaco A induce maggiori guarigioni rispetto al farmaco B (o viceversa).

24 la selezione viziata la selezione viziata fornisce un campione non rappresentativo (distorto)

25 variabilità tra gli individui
Ovviamente, l'errore di campionamento è condizionato dall'esistenza di variabilità tra gli individui che compongono la popolazione di partenza; se tutti - per assurdo - avessero lo stesso carattere in egual misura, l'esame di qualsiasi numero di individui fornirebbe lo stesso valore, e quindi l'errore di campionamento sarebbe nullo. La selezione viziata è quella che viene effettuata su un segmento non rappresentativo della popolazione. Questo avviene quando la scelta delle unità che costituiranno il campione viene effettuata con regole non rigorosamente causali. Talvolta, è lo stesso sperimentatore che, definendo delle regole estem-poranee volte a neutralizzare - nelle intenzioni - gli effetti del caso e di ottenere un campione più aderente alla popolazione, commette un errore che rende i dati inutilizzabili. Infatti, un campione che non è stato ottenuto correttamente fornisce misurazioni e risultati per i quali è impossibile calcolare il cosiddetto «errore di campionamento». La selezione viziata fa sì che all'errore campionario si sommi un altro tipo di errore, detto bias (errore non campionario)

26 ESEMPIO 1: Vogliamo accertare la proporzione di cani vaccinati contro il cimurro in una provincia.
Non potendo esaminare tutti i cani dell'area considerata, decidiamo di esami-nare un campione di individui. Per comodità, scegliamo i cani che vengono presentati presso alcuni ambula-tori del capoluogo. Il campione così ottenuto sarà sicuramente distorto (affetto da "bias"), in quanto composto quasi esclusivamente da cani "cittadini" che, notoriamente, sono oggetto di maggiori cure da parte del proprietario rispetto a quelli che risiedono in campagna. Inoltre, anche il fatto stesso che il cane venga portato in ambulatorio testimo-nia l'attenzione da parte del proprietario verso la salute del suo animale, ed è probabile che questa attenzione si sia tradotta in una corretta profilassi vaccinale. Quindi, il nostro campione sarà distorto perché (1) ha selezionato cani cittadi-ni e (2) ha selezionato cani portati in ambulatorio. Presumibilmente, tutti i cani del nostro campione (distorto!) risulteranno vaccinati per il cimurro e quindi potremmo concludere erronea-mente che "tutti i cani della provincia sono vaccinati per il cimurro".

27 ESEMPIO 2. Il frammento prelevato con una biopsia epatica rappresenta circa 1/50000 dell'organo. Essendo il campione così piccolo rispetto all'intero organo, esiste la possibilità di ampie variazioni da un campione all'altro. Inoltre, poichè il frammento viene esaminato, in genere, allo scopo di diagnosticare una malattia dell'intero fegato, esiste la possibilità che il processo di inferenza sia viziato. Ad esempio, si preleva un campione di tessuto sano in un organo ammalato.

28 In conclusione In conclusione, si può affermare che soltanto quando la scelta degli individui che compongono il campione è stata dettata dal puro e semplice caso, è possibile prevedere e calcolare l'entità della differenza tra campione e popolazione. In caso contrario, il campione si dice «distorto»». Con un campione distorto, non è possibile calcolare l'errore di campionamento ed i dati ottenuti saranno difficilmente utilizzabili. bias o distorsione: differenza, causata da un errore sistematico, tra la stima ottenuta da un campione e la vera caratteristica della popolazione

29 «bias» Più precisamente, per «bias» si intende "un processo, effettuato in qualsiasi stadio della inferenza, che tende a fornire risultati che si discostano sistematicamente dai valori veri".

30 Nello schema A dell'immagine a lato sono raffigurati due bersagli
Nello schema A dell'immagine a lato sono raffigurati due bersagli. Quello a sinistra (A1) è il risultato di 17 tiri effettuati da un buon tiratore che ha sparato con un buon fucile. L'insieme dei fori si può considerare come un campione delle infinite possibili combinazioni di 17 tiri che quel tiratore può ottenere sparando con quel fucile. Come si vede, i fori hanno una disposizione casuale, ma tendono a disporsi attorno al centro del bersaglio. Il bersaglio di destra (A2) è stato utilizzato dallo stesso tiratore, ma con un fucile con il mirino disassato. Anche in questo caso, i fori hanno una disposizione casuale, ma tendono a disporsi attorno ad un punto che NON corrisponde al centro del bersaglio. ESEMPIO Supponi (schema B) di non conoscere la vera posizione del centro bersaglio (che, fuor di metafora, equivale alla VERA caratteristica della popolazione in studio, la quale in effetti non è mai nota). Supponi anche di estrarre a caso un campione di 17 colpi dagli infiniti campioni possibili. Con un buon campionamento (che equivale ad un buon fucile) otterrai il campione raffigurato a sinistra (B1); se, invece, il campione sarà affetto da bias, otterrai un campione come quello a destra (B2). Ora, sempre in base ai dati dello schema B, prova ad "inferire" (ossia ad indovinare) la posizione del bersaglio nel momento in cui sono stati sparati i colpi.

31 concludendo … Ragionevolmente collocherai i bersagli come indicato nello schema C: con il campione di colpi di sinistra (C1) (cioé quello del fucile preciso) l'inferenza sarà attendibile, come dimostra la corretta collocazione del centro del bersaglio rispetto alla realtà (così come raffigurato in A1). Al contrario, utilizzando il campione distorto (C2), sarai indotto a ritenere che il centro del bersaglio sia spostato rispetto al reale e non riuscirai a posizionarlo correttamente. In quest'ultimo caso, fuor di metafora, non sarai in grado di stimare correttamente la vera caratteristica della popolazione.

32 Metodi di campionamento
OBIETTIVO: descrivere la logica di un buon campionamento ed elencare alcuni dei più comuni metodi di campionamento

33 Il principio informatore generale
Un buon campionamento prevede di utilizzare lo stesso principio dell'estrazione a sorte, ossia quello della casualità assoluta, in modo tale che ciascun membro della popola-zione abbia la stessa probabilità di entrare a far parte del campione. In tal caso il campione viene detto «rando-mizzato» o «casuale». Affidandosi al caso si ottiene, in una qualche misura, la garanzia che il campione sarà rappresentativo della popo-lazione stessa, ossia ne rifletterà le caratteristiche con una certa approssimazione.

34 Un buon campionamento offre a ciascun membro della popolazione ha la stessa probabilità di essere scelto Immagina di avere una lista di individui, e che una metà di questi siano maschi e l'altra metà siano femmine. La teoria statistica delle probabilità dice in anticipo che, se estrarrai in modo casuale mille soggetti dalla lista, otterrai un campione composto per metà da maschi e per metà da femmine, con un livello di approssimazione prevedibile a priori. Analogamente, supponi di ripetere molte volte il lancio di una moneta. L'evento "testa" o "croce" è condizionato soltanto dal caso: le prime volte potrà uscire sempre "testa" (oppure sempre "croce"), ma alla lunga la proporzione di teste e croci nella "popolazione" di lanci tenderà ad equilibrarsi

35 Un campionamento randomizzato
offre il vantaggio di fornire un campione privo di errori sistematici (bias) e consente di accertare l'attendibilità dei risultati o, per meglio dire, i rapporti fra i risultati forniti dal campione e la vera caratteristica della popolazione. Fra i tanti metodi esistenti, verrà brevemente accennato a quattro: campionamento non probabilistico (o campionamento "di convenienza") campionamento per randomizzazione semplice (o campionamento casuale semplice) campionamento per randomizzazione sistematica (o campionamento sistematico) campionamento per randomizzazione stratificata (o campionamento stratificato) campionamento a grappolo (campionamento a "cluster")

36 campionamento randomizzato
campionamento casuale semplice campionamento sistematico campionamento stratificato campionamento a "cluster"


Scaricare ppt "Scopi del campionamento"

Presentazioni simili


Annunci Google