Test t di Student (Confronto di due medie) Vi sono molte situazioni in cui occorre confrontare una variabile qualitativa con una quantitativa, una qualitativa con un'altra qualitativa, più variabili quantitative con una o più variabili numeriche. Un caso comune è quello in cui sono sotto esame due campioni in ciascuno dei quali è stata misurata una variabile numerica (p.e. peso) di cui è stata poi calcolata la media. Lo scopo del test è quello di provare se la differenza fra le due medie è significativa, ossia affermare che la differenza non è dovuta al caso ma esiste una reale diversità tra le medie delle due popolazioni da cui i campioni stessi derivano.
Per determinare il valore t, diamo la seguente formula di calcolo: ma = media del primo campione; mb = media del secondo campione; na = numerosità del primo campione; nb = numerosità del secondo campione; s è la deviazione standard media delle deviazioni standard dei due campioni (la radice quadrata della varianza che si ottiene sommando le devianze dei due campioni e dividendo per la somma dei gradi di libertà). Una volta trovato il valore t, esso va confrontato con quelli tabulati al fine di stabilire se la differenza fra le due medie non è dovuta al caso.
Un esempio di applicazione del test t Vogliamo sperimentare l’abilità culinaria di una vostra amica verificando l’effetto della sua cucina sul peso forma di un campione di persone. Individuiamo due piccoli gruppi di persone, fra loro omogenei (sesso, età) e soggetti alle stesse condizioni ambientali (alimentazione, temperatura ambiente). L'unica differenza è che la razione del Gruppo 1 (11 individui) viene preparata dalla vostra amica, mentre quella del gruppo 2 (11 individui) no. All'inizio dell'esperimento ciascun individuo viene pesato; L’operazione di peso viene ripetuta dopo 7 giorni di “trattamento” e per ogni individuo si calcola l'incremento giornaliero medio di peso.
Dati e risultati TDIST(2,1334;20;2) campione 1 campione 2 63 65 64 63,3 63,1 64,1 63,7 64,2 63,8 67 63,4 62,6 63,6 66 campione di dati 1 2 Numerosità campione (n) 11 Media (m) 64,5364 63,7000 Dev. Standard (S) 1,1378 0,6293 t 2,1334 gradi di libertà 20 (numero dati - numero campioni) (n1+n2-2) p (livello di significatività) 0,0455 TDIST(2,1334;20;2)
Confrontando le medie degli accrescimenti si nota come il valore del Gruppo 1 sia superiore a quello del Gruppo 2 (64.54 g/giorno contro 63.70 g/giorno). Vogliamo capire se questa differenza è dovuta alla cucina della vostra amica oppure a casualità. (L'ipotesi zero dice che la differenza è dovuta al caso...) Usando i dati dell’esempio, si ottiene per t un valore di 2.1334. Questo valore va confrontato con quelli presenti in tabella per 20 gradi di libertà (gradi di libertà = numerosità campioni-numero gruppi, ossia 22-2). Dall’analisi della tabella, si osserva che detto valore è superiore a quello della colonna p=5% ed inferiore a quello della colonna p=1%. Possiamo concludere che la differenza è significativa per p<0.05 ma non per p<0.01. Ciò significa che c'è una probabilità inferiore al 5% (ma non all'1%) che la differenza di accrescimento tra il gruppo trattato (1) e quello di controllo (2) sia dovuta al caso.
Concludiamo sottolineando che risultati di un test statistico vanno interpretati correttamente. Qualsiasi test di significatività non può mai provare con certezza che una ipotesi zero è vera o falsa; Tuttavia può fornire indicazioni sulla forza con cui i dati contrastano l'ipotesi zero. Ipotesi Zero: Non esiste differenza fra i gruppi per il parametro in esame Test di Significatività (p.e. T student) Accettare o rifiutare l’Ipotesi Zero