Confronto tra 2 campioni Nella pratica è utilissimo confrontare se 2 campioni provengono da popolazioni con la stessa media: Confronti tra produzioni di boschi, di pascoli, di animali allevati con 2 tecniche ecc. Lapproccio più ovvio sarebbe quello di costruire gli intervalli fiduciali delle 2 medie e verificare se si sovrappongono o meno. Se non cè sovrapposizione, con il rischio che abbiamo usato per calcolare i limiti fiduciali, affermiamo che i due campioni NON provengono da popolazioni con media uguale (e pertanto cè una differenza tra le medie = lesistenza di una differenza tra le medie non è casuale = i campioni sono tratti da popolazioni diverse). Se gli intervalli fiduciali non sono sovrapposti, tutto OK, ma se sono sovrapposti questo metodo non è il più potente: si può usare un metodo in grado di riconoscere diverse per ragioni non casuali (= significativamente diverse) medie che differiscono di meno
Confronto tra 2 campioni (1) Tecnica basata sulla stima dellerrore standard della differenza tra 2 medie nellipotesi di varianza uguale delle popolazioni. si propone unipotesi di partenza: lipotesi nulla H 0, tha le 2 medie non cè differenza: H0: 1 = 2 o, che è lo stesso, H0: =0 Si sa che il valore della differenza tra le medie di 2 popolazioni è stimata dalla media della differenza tra le medie dei campioni, e che la varianza della somma(differenze) tra medie campionarie è la somma delle 2 varianze dei 2 campioni. Ipotizzando di conoscere, allora lerrore standard della differenza tra 2 medie sarà:
Confronto tra 2 campioni (2) Se la varianza della popolazione è ignota, posso stimarla dalle varianze campionarie, e la stima sarà la media delle varianze, ponderata rispetto ai loro relativi gradi di libertà: E, analogamente a prima, lerrore standard della differenza tra due medie campionarie diventa:
Confronto tra 2 campioni (3) Abbiamo quindi una nuova variabile, della quale sappiamo lerrore standard : Quindi possiamo usare la distribuzione del t per testare la differenza tra le medie di 2 popolazioni disponendo di campioni. I gradi di libertà saranno la somma dei gradi di libertà usati per stimare le varianze dei 2 campioni (n 1 +n 2 -2) con la quale stimiamo: Quindi, se lipotesi nulla è vera:
Confronto tra dati appaiati Spesso si ha a che fare con dei dati rilevati sulle stesse unità sperimentali prima e dopo un trattamento, un periodo di tempo ecc.. In tal caso si parla di dati appaiati, li si potrebbe trattare come visto prima, ma ciò comporterebbe la perdita dellinformazione che il soggetto è lo stesso. Si calcola una nuova variabile casuale, le cui determinazioni sono x i -y i ;di questa variabile possiamo calcolarne la media e lerrore standard e verificare se essa è compatibile con la distribuzione del t, nellipotesi nulla che la nuova variabile abbia media 0. H 0 : (x i -y i )=0 se indichiamo con la popolazione delle differenze, allora H 0 : =0 e Questo test non risente delle differenze tra i dati, funziona anche su coppie di dati dal valore molto diverso, ma ha molti meno GL del test per dati indipendenti
Il test statistico