I TEST DI SIGNIFICATIVITA' IL TEST DI STUDENT
Si parte dal presupposto che il nostro campione discenda dalla popolazione: e' questa la c.d. ipotesi nulla o zero (Ho); l'ipotesi nulla e' vera quando campione e popolazione coincidono; invece l'ipotesi nulla e' falsa o rigettata quando campione e popolazione non coincidono (H1 ipotesi alternativa).
I test di significativita' sono test statistici che quantificano i dati in senso di probabilita': i livelli del 5 % (0.05) e dell' 1 % (0.01) sono livelli accettati come limiti del tutto convenzionali per stabilire la significativita' di uno scarto dall'ipotesi zero. Il livello di 5 % sta ad indicare che ci sono 95 proba- bilità su 100 che il mio campione non derivi dalla popolazione, cioè che sia diverso. Tuttavia, esistono sempre 5 probabilità su 100 che tali differenze siano casuali e che quindi il campione derivi dalla popolazione.
L'errore alfa (detto anche di I° tipo) prende per valide differenze che in realta' (nell'universo) non esistono. Le tecniche per ridurre l'errore alfa si chiamano "significativita' ". L'errore beta (detto anche di II° tipo) non si accorge di differenze che realmente sono presenti nell'universo. Le tecniche per ridurre l'errore beta si chiamano "potenza". E' ovvio che piu' aumenta il numero delle osservazioni e piu' si riducono gli errori alfa e beta.
POTENZA DI UN TEST Per mantenere il piu' piccolo possibile l'errore ß bisogna usare i tests piu' potenti; la potenza di un test dipende da tre fattori interagenti: 1) rischio di errore di tipo I che si vuole accettare nel rifiutare l'ipotesi (in genere 0.05); 2) la dimensione del piu' piccolo effetto che, dal punto di vista medico, ha senso rilevare (relativamente alla variabilità della popolazione); 3) la numerosita' del campione: piu' e' alta, e piu' e' potente un test statistico.
Ricordando la formula del t test di Student si nota come "t" dipende dalla differenza delle due medie normalizzata per la DS della popolazione (in pratica delta/sigma). Quindi seguendo il grafico in diapositiva si puo' calcolare la potenza di un test per alfa = 0.05. Da tener presente che nel caso di numerosita' diverse dei 2 campioni va usata la piu' piccola delle 2 numerosita'.
CONFRONTO DI 2 MEDIE Bisogna premettere che per utilizzare questi test statistici e' indispensabile sia che i due o piu' gruppi di dati siano distribuiti in modo normale, sia che le varianze siano abbastanza simili. Se non esiste la normalita' e le varianze sono abbastanza diverse bisogna cercare una trasformazione opportuna delle misure originali, ad es. una trasformazione logaritmica.
Paired t test: Se i dati sono appaiati (ad es. un certo dato prima e dopo terapia) bisogna usare il cd. paired t test con formula: _ D/ (DS D2 /n) (dove D rappresenta la Differenza fra le coppie) Con l'SPSS i comandi sono: TTEST PAIRS c1 c11/peso1 peso2/testo1 testo2. TTEST PAIRS c1 WITH c2 c3 c4 c5. (in quest'ultimo caso c1 e' saggiato volta per volta con c2 c3 c4 c5).
T di Student: Se i dati non sono appaiati si deve usare il t test di Student (un test esclude l'altro, cioe' non si possono usare ambedue): t = m1 - m2 / (DS12/n1) + (DS22/n2) Con l’ SPSS: TTEST GROUP sesso(1,2)/VAR=eta peso ps t3. L'SPSS controlla l’uguaglianza delle varianze con il test di Levene: il risultato da’ due valori di t: il primo "pooled"o "equal" valido quando l'analisi della varianza (valore F) non e' significativa, il secondo "separate" o "non equal" valido quando l' F e' significativo.
CONFRONTO DI 2 VARIANZE Per il confronto di 2 varianze si puo' usare l' F di Fisher: F = DS12 / DS22 Il test F e' un ottimo test per confrontare due varianze stimate su 2 campioni indipendenti di variabili casuali normali (cioe' con distribuzione normale), ma sfortunatamente il test e' molto piu' sensibile dei precedenti alla condizione di normalita'. Da notare che F e' uguale al t2 nel caso di confronto a due.
Con l’SPSS l’F si ottiene con: ONEWAY peso BY sesso(1,2). ONEWAY testo1 BY eta(1,4). Con l'opzione STAT=1 si ottengono anche, oltre all'analisi della varianza, media, DS, SE, range e limiti di confidenza per ogni variabile per ogni gruppo: ONEWAY testo1 BY eta(1,4)/stat=1.
CONFRONTI MULTIPLI Uno degli errori piu' frequenti che si compie in statistica e' quello di valutare differenze fra piu' di 2 gruppi, confrontando con il t test di Student tutte le possibili coppie di medie. Se i gruppi sono 3, tre sono pure i possibili confronti, ognuno dei quali da' una probabilita' di errore di 0.05 e quindi una probabilita' totale di 0.05*3=0.15 (15% di probabilita' che le differenze eventualmente trovate siano legate al caso). Se i gruppi sono 4 i confronti possibili sono sei e quindi 0.05*6=0.30 (30% di probabilita' che le Per superare l'errore e' indispensabile in tali casi ricorrere all'analisi della varianza.
L'analisi della varianza pero' esamina solo l'ipotesi globale che tutti i campioni siano estratti dalla stessa popolazione, cioe' non da' informazioni su quale campione (o campioni) differisce dagli altri. L'SPSS, tramite il comando ONEWAY, fornisce diversi metodi chiamati procedure per confronti multipli che correggono i risultati ottenuti con il t di Student tenendo conto della molteplicita' dei confronti.
Test per confronti multipli 1) test di Student-Neuman-Keuls (SNK): la significativita' e' solo dello 0.05: es. ONEWAY c1 by c5(1,3)/RANGE=SNK/STAT=1. 2) test di Duncan: fornisce le significativita' 0.05 e 0.01); ONE c1 by c5(1,3)/RANGE=DUNCAN(0.01) /STAT=1.
3) test MODLSD (modified least significant difference); fornisce tutti i livelli di signifi- cativita' segnati tra parentesi: es: ONE c1 by c5(1,3)/RANGE=MODLSD(0.025) /STAT=1. Da notare che con RANGE=LSD si ottengono tutti i possibili confronti senza alcuna correzione del t di Student. 4) test di Scheffe (tutti i livelli di significativita'): ONE c1 by c5(1,3)/RANGE=SCHEFFE(0.01)