5) IL CAMPIONE CASUALE SEMPLICE CON RIPETIZIONE
CAMPIONE: sottoinsieme delle unità che formano la popolazione oggetto di riferimento. ESEMPIO P=popolazione formata da N=4 unità (palline) sulle quali sono presenti le manifestazioni di un generico fenomeno qualitativo X (contrassegno). A seguito di una rilevazione si ottiene: Variabile statistica Oppure (con la variabile statistica articolata in frequenze relative):
Numero casi favorevoli Si vuole ora avere informazioni sullo stesso fenomeno ma entrandone in possesso solo in via campionaria. Si effettuano cioè in P n=2 scelte “bernoulliane”: supponendo le palline assolutamente identiche (a meno del contrassegno) se ne estrae una; letto il numero, la si introduce ancora nell’urna (per riprodurre nuovamente la variabile statistica c), quindi si procede ad una seconda estrazione. Supponendo che la coppia di numeri estratti sia (170,160), essa viene chiamata “campione bernoulliano” articolato in n=2 prove. L’attributo “con ripetizione” indica che la stessa pallina può essere estratta in entrambe le prove. Definizione classica di probabilità: Numero casi favorevoli Numero casi possibili Condizione: i casi possibili devono tutti essere alla pari
Nel nostro caso le relative probabilità di costituire l’esito della scelta sono: Le tre coppie (160,1/4), (170,2/4), (180,1/4), prendono il nome di variabile casuale X. N.B. C X Cioè la variabile statistica e la variabile casuale coincidono essendo le quattro palline identiche e note per quanto riguarda i rispettivi contrassegni. Ovviamente la var. statistica tiene conto di ciò che si è osservato, mentre la var. casuale descrive ciò che potrà accadere. Ora: con la prima scelta può accadere:
Ciò che può accadere nella prima scelta è descritto dalla v.c. X1: con la seconda scelta può accadere: Poiché ciascun risultato della seconda scelta può associarsi a ciascun risultato della prima, le coppie possibili (una delle quali costituirà l’esito campionario) sono: I prova (x1) II prova (x2) campione (x1, x2) 160 (160, 160) 160 170 (160, 170) 180 (160, 180) : 160 (170, 160) 170 170 (170, 170) 180 (170, 180) 160 (180, 160) 180 170 (180, 170) 180 (180, 180)
Le nove coppie (x1, x2) sono le possibili determinazioni della v. c Le nove coppie (x1, x2) sono le possibili determinazioni della v.c. bidimensionale (X1, X2). Si tratta ora di associare ai nove campioni le corrispondenti probabilità di essere l’esito delle 2 prove. Essendo le due prove in questione indipendenti, cioè tali che l’esito di una prova prescinde totalmente dall’esito dell’altra, la probabilità che la v.c. (X1, X2) valga la coppia (x1, x2) è data da: P(X1 = x1, X2 = x2) = P(X1 = x1)·P(X2 = x2) Le probabilità associate alle nove coppie campionarie si riassumono nella seguente tabella dove i valori interni sono proprio queste probabilità, mentre i valori dell’ultima riga e dell’ultima colonna sono le probabilità chiamate marginali, che caratterizzano gli eventi della prima prova e della seconda prova separatamente.
In precedenza si è supposto che le due scelte nell’urna fornissero la coppia (170,160); dalla tabella emerge ora che un tale evento ha probabilità di verificarsi pari a 1/8. In pratica la formazione del campione non avviene ricorrendo alla scelta con ripetizione in un’urna dove è riprodotta la popolazione in esame, ma avviene secondo criteri proposti dalla teoria delle rilevazioni campionarie. In generale il campione viene realizzato con una scelta in blocco di n unità, cioè n unità contemporaneamente, così che sia esclusa la possibilità di assumere più di una volta la stessa informazione.
È possibile provare che, se la numerosità della popolazione è sufficientemente elevata, i due campioni con ripetizione o in blocco portano agli stessi risultati. Per questo motivo si suppone spesso che il campione sia del tipo con ripetizione che consente il ricorso a formule più semplici.