STATISTICA a.a. 2003-2004 LA STATISTICA INFERENZIALE TEST A UNA CODA E A DUE CODE TEST DEL CHI QUADRATO
CONFRONTO FRA POPOLAZIONI Uno scopo della statistica è determinare se le caratteristiche di due popolazioni sono differenti o meno. Si traggono cioè conclusioni sulla popolazione, determinando un’inferenza statistica. Possiamo confrontare campioni o popolazioni attraverso le medie o le varianze.
CONFRONTO FRA POPOLAZIONI Per effettuare un confronto si ricorre al test statistico. Il test statistico è il procedimento che consente di rifiutare o non rifiutare (accettare ) un’ipotesi sulla popolazione Il test assegna un certo valore di probabilità all’ipotesi che viene formulata.
L’IPOTESI NULLA Si usa in genere la cosiddetta ipotesi nulla (H0). Essa postula come inesistenti (nulle, pari a zero) le differenze fra le caratteristiche delle popolazioni in esame (H0 : A=B). Un test statistico consente di provare l’inaccettabilità (con una certa quota di errore) di un’ipotesi, ma non di provarla.
L’IPOTESI NULLA Se la probabilità che l’ipotesi nulla sia vera è bassa, vorrà dire che le popolazioni confrontate sono verosimilmente differenti. Confrontare un modello con un campione sperimentale, tramite un test statistico, significa provare la concordanza tra i dati reali e il modello, cioè la validità del modello.
L’IPOTESI NULLA Prima dell’esperimento si stabilisce il valore limite per la probabilità che l’ipotesi nulla sia vera. Per probabilità inferiori a tale valore stimeremo falsa l’ipotesi nulla. Per probabilità superiori, non si è in grado di rifiutare l’ipotesi nulla.
L’IPOTESI NULLA Per convenzione si adottano due livelli di significatività: se la probabilità che l’ipotesi nulla sia vera è uguale o minore al 5% (p<=0.05) si dice che la differenza fra le popolazioni considerate è significativa se la probabilità è minore o uguale all’1% (p<=0.01) si dice che la differenza fra le popolazioni è altamente significativa.
L’IPOTESI NULLA Se la probabilità è maggiore di 0.05, non si può concludere che le popolazioni considerate sono uguali, ma si può ammettere di non avere elementi sufficienti per affermare l’esistenza di una differenza. Il livello di significatività è il rischio di rifiutare erroneamente l’ipotesi nulla quando questa è vera.
L’IPOTESI NULLA Questo errore è definito come errore di I tipo o errore a . La probabilità di non rifiutare l’ipotesi nulla quando questa è in realtà falsa (ossia di accettare un’ipotesi nulla falsa) viene detta errore di II tipo o errore b .
STRUTTURA DEI TEST Un test di significatività consiste nel calcolo di un parametro e della distribuzione di probabilità ad esso associata. Questi parametri (chi quadrato, t di student, ecc.) hanno distribuzioni di probabilità diverse a seconda del numero di gradi di libertà (GdL) impiegati nel calcolo. Queste diverse distribuzioni sono tabulate su apposite tavole.
USO DELLE TAVOLE Le tavole permettono di evitare di ricorrere alle equazioni delle curve di distribuzione del parametro. In una tavola vengono riportati i valori del parametro che vengono superati nel 5% dei casi, o nell’1% o in una frazione interessante (10%, 50%, ecc.). Ottenuto il valore del parametro si valuta sulla tavola se supera il valore corrispondente alla probabilità prescelta.
USO DELLE TAVOLE Nel caso in cui il parametro superi tale valore critico, la probabilità che ciò sia avvenuto casualmente è inferiore alla probabilità critica prescelta. Quindi si considerano significativamente differenti le due popolazioni in questione. In tal modo la probabilità di definire differenti popolazioni che non lo sono (errore del I tipo) è pari al livello critico prescelto (es. 5%).
TEST A UNA CODA E TEST A DUE CODE Supponiamo di confrontare due serie di dati A e B Se in seguito ad un test statistico rifiutiamo l’ipotesi nulla H0 : A=B dobbiamo assumere un’ipotesi alternativa. Si possono creare due diverse situazioni: può interessare solo la differenza fra le due serie di dati nel senso di A>B (oppure A <B) e quindi l’ipotesi alternativa sarà H1 : A>B
TEST A UNA CODA E TEST A DUE CODE Supponiamo di confrontare due serie di dati A e B Se in seguito ad un test statistico rifiutiamo l’ipotesi nulla H0 : A=B dobbiamo assumere un’ipotesi alternativa. Si possono creare due diverse situazioni: può interessare solo la differenza fra le due serie di dati nel senso di A>B (oppure A <B) e quindi l’ipotesi alternativa sarà H1 : A>B oppure H1 : B>A
TEST A UNA CODA E TEST A DUE CODE Può non interessare la deviazione in un solo senso e quindi ci si limita alla verifica dell’ipotesi di uguaglianza fra A e B. Nel primo caso (test a una coda o unilaterale) si deve considerare la probabilità che la serie A sia maggiore della serie B Nel secondo caso (test a due code o bilaterale) si deve considerare la probabilità che la serie A sia maggiore della B oppure che la B sia maggiore della A.
TEST A UNA CODA E TEST A DUE CODE Se p1=P(A>B) e p2=P(B>A), nel caso del test a due code si avrà pT=p1+p2=Probabilità totale Nella distribuzione normale, se si ha una probabilità del 5% di trovare un valore esterno a m +/- 1.96 s (probabilità a due code), si ha una probabilità del 2.5% di trovare un valore superiore a m +1.96 s (probabilità ad una coda).
TEST A UNA CODA E A DUE CODE All’inizio dell’esperimento occorre stabilire se il test di significatività sarà a una o a due code, ossia se interessano le variazioni in un solo senso (maggiore o minore) o in tutti e due i sensi . Un certo valore del parametro sarà significativo a livello di probabilità p per il test bilaterale, al livello p/2 per il test unilaterale.
TEST A UNA CODA E A DUE CODE La scelta del test unilaterale non dovrebbe essere presa dopo aver visto i dati e la direzione della loro deviazione, ma a priori e solo se si ha la certezza che le deviazioni in una direzione si verificano solo per caso e quindi non saranno mai significative.Ciò avviene raramente: è meglio usare i test bilaterali anche se hanno livello critico più alto e quindi significatività minore.
TEST DEL CHI-QUADRATO Supponiamo di avere due popolazioni nelle quali ogni individuo abbia probabilità P1 e P2 di mostrare la caratteristica A. In un campione casuale proveniente dalla prima popolazione, r membri hanno la caratteristica A e quindi frequenza relativa r1/n1 Nella seconda popolazione la frequenza relativa è r2/n2.
TEST DEL CHI-QUADRATO Questi dati possono essere esposti nella tabella di contingenza 2x2: Caratteristica A Presente Assente campione1 r1 n1-r1 n1 campione2 r2 n2-r2 n2 ___________________________________ r1+r2 (n1-r1)+(n2-r2) n1+n2
TEST DEL CHI-QUADRATO Il totale delle osservazioni è a destra in basso. Le quatto celle interne rappresentano le frequenze osservate. L’ipotesi nulla afferma che la frequenza relativa della caratteristica A è uguale nelle due popolazioni (P1=P2).
TEST DEL CHI-QUADRATO Ad esempio abbiamo due campioni indipendenti di 45 e 46 pazienti affetti da infarto acuto. Nel primo gruppo viene somministrato propanololo, nel secondo no. Ad un mese di distanza si valutano sopravvissuti e si ottiene la seguente tabella:
TEST DEL CHI-QUADRATO Trattamento Propanololo Controllo sopravvissuti 38 29 67 no 7 17 24 ___________________________________ 45 46 91
TEST DEL CHI-QUADRATO Secondo l’ipotesi nulla i tassi di sopravvissuti nelle due popolazioni sono identici . Tale tasso, stimato sui campioni, si ottiene dal rapporto 67/91 = 0.736. Se è vera l’ipotesi nulla, la proporzione di sopravvissuti deve essere mantenuta nei due gruppi (numero di unità attese). Nel primo gruppo il numero atteso di sopravvissuti è 45(67/91)=33.132
TEST DEL CHI-QUADRATO Nel gruppo di controllo il numero atteso è 46(67/91)=33.868. Allo stesso modo il numero atteso di decessi è nel primo gruppo 45(24/91)= 11.868 e nel gruppo di controllo 46(24/91)=12.132
TEST DEL CHI-QUADRATO Il test del chi-quadrato per il confronto di due proporzioni in campioni indipendenti si basa sulla differenza fra frequenze osservate O e attese E:
TEST DEL CHI-QUADRATO Trattamento Propanololo Controllo Sopravvissuti 38 29 67 E 33.132 33.868 O – E 4.868 - 4.868 (O-E)^2/E 0.715 0.700 Deceduti 7 17 24 E 11.868 12.132 O – E -4.868 4.868 (O-E)^2/E 1.997 1.953 ___________________________________________________ 45 46 91
TEST DEL CHI-QUADRATO I valori di E danno come somma di riga e di colonna i totali osservati, ed è per questo che i quattro scarti hanno lo stesso valore assoluto. Tanto maggiore è lo scarto tanto più è ragionevole orientarsi contro l’ipotesi zero. E’ ragionevole dividere il quadrato degli scarti per i valori attesi, in modo che la differenza venga “normalizzata”.
TEST DEL CHI-QUADRATO Calcolato il valore atteso di una cella, visto che gli E danno gli stessi totali di riga e di colonna, le altre quantità attese si possono derivare per sottrazione dai totali marginali: esiste quindi una sola quantità attesa indipendente e per questo si dice che per una tabella di contingenza 2x2 vi è un grado di libertà (GdL) per il calcolo del chi-quadrato. Il calcolo del chi-quadrato è la sommatoria delle quattro celle (O-E)^2/E: Χ2= 0.715 + 0.7 + 1.997 + 1.953 = 5.365
TEST DEL CHI-QUADRATO Nella tabella per la distribuzione chi-quadrato con 1 GdL si nota che il valore calcolato è compreso fra i valori 5.02 e 6.63, corrispondenti a p=0.025 e p=0.01. Quindi la differenza fra le due mortalità è significativa perchè p<0.05. La stessa procedura di calcolo si può estendere a tabelle 2 * k o addirittura r * k per confrontare più campioni. I GdL di una tabella r * k saranno (r-1) * (k-1).
TEST DEL CHI-QUADRATO Esiste un modo alternativo di calcolo per il chi-quadrato: Colonne a b r1 Righe c d r2 _____________________________________________ c1 c2 N
CORREZIONE DI YATES Va ricordato che il test chi-quadrato va usato con tabelle le cui entrate siano frequenze. E’ un errore usarlo con valori medi oppure percentuali. Il test chi-quadrato è un metodo approssimato valido quando le frequenze sono grandi. Una regola perchè sia valido è che il valore atteso di ogni cella sia maggiore o uguale a 5. Quando le frequenze attese sono basse (ma sempre >5) si applica la correzione di Yates che riduce di ½ la grandezza assoluta di (O-E) per ciascuna cella:
CORREZIONE DI YATES
CORREZIONE DI YATES La correzione è dovuta al fatto che il chi-quadrato si basa sull’approssimazione normale della binomiale e quindi si tratta di una correzione per la continuità. Nel nostro esempio utilizzando le nuove formule si ottiene ancora una p significativa, anche se meno significativa che nel caso senza correzione.
TEST ESATTO DI FISHER Per frequenze assolute molto basse anche la correzione per la continuità non è sufficiente. Quando la numerosità totale è inferiore a 20 o è compresa fra 20 e 40 ma il valore atteso più basso è inferiore a 5 si usa il test esatto di Fisher. Supponiamo di dover confrontare la virulenza di due ceppi batterici A e B dopo inoculazione in cavie:
TEST ESATTO DI FISHER Ceppo batteri A B Viva 6 4 10 Esito cavie Morta 14 12 26 _______________________________________ 20 16 36
TEST ESATTO DI FISHER Il campione non è grande e le frequenze attese delle due prime celle sono basse. L’ipotesi nulla ci dice che la proporzione dei morti nei due gruppi di animali è la stessa. In pratica si calcola la probabilità totale del campione osservato secondo la formula di Fisher ( r1! r2 ! c1 ! c2 !)/ (a! b! c! d! N!) e poi si va a vedere nella tabella corrispondente alla distribuzione risultante della probabilità cumulativa.