Analisi della varianza La situazione in teoria Campione di n*m elementi: n: numero di repliche m: numero di trattamenti i: indice delle repliche j: indice dei trattamenti
Le formule i: indice delle repliche j: indice dei trattamenti Media del trattamento: Media totale: Devianza dovuta ai trattamenti (TRA): Devianza totale: Devianza interna ai trattamenti (IN): i: indice delle repliche j: indice dei trattamenti
In generale In particolare Ipotesi Nulla: Statistica del test: L’analisi della varianza è una metodologia per verificare se due o più popolazioni sono caratterizzate dalla stessa media (o più medie sono estratte dalla stessa popolazione) In particolare Nell’analisi della varianza a una via si considera una sola causa di variazione (detta Gruppo, Fattore, Trattamento, Livello, etc…) nell’esito di ciascun esperimento Ipotesi Nulla: Le popolazioni da cui sono stati estratti i campioni hanno tutte la stessa media μ1= μ2 = … = μm Statistica del test: Se i campioni possono venir considerati estratti dalla stessa popolazione (o da popolazioni con media uguale, il Rapporto F dev’essere circa uguale a 1 e si comporta come una distribuzione di Fisher con m-1 e n-m gdl
Osservazioni indipendenti Distribuzione Normale delle popolazioni Se il valore calcolato Rapporto F è più grande del valore tabulato Fα(m-1, m-k), allora si può rifiutare l’ipotesi nulla all’ α % di significatività N.B. Quando questo si verifica, significa soltanto che almeno uno dei campioni si comporta in maniera diversa dagli altri. L’analisi della varianza si può usare quanto sono soddisfatte le seguenti 3 condizioni: Osservazioni indipendenti Distribuzione Normale delle popolazioni Varianza omogenea per ciascuno dei campioni
Osservazioni indipendenti Le osservazioni sperimentali si dicono indipendenti quando l’esito di ciascuna misura non è influenzato dalla precedente, di conseguenza tale condizione viene garantita dalla natura dello schema sperimentale. Distribuzione Normale delle popolazioni i: indice delle repliche j: indice dei trattamenti Modello Teorico … in pratica Stima del residuo(errore)
Test di normalità di Shapiro-Wilk sui residui Il requisito di normalità impone che la distribuzione dei dati all’interno di ciascun Gruppo, Fattore, Trattamento, Livello, etc… sia Normale e questo corrisponde a richiedere che la distribuzione dei residui sia Normale, dal momento che questi ultimi, per definizione sono calcolati tenendo conto delle medie di ciascun fattore. Nel caso dell’ANOVA ci sono quindi due opzioni per verificare la normalità: se i gruppi sono pochi (<4) e le repliche sono tante (>20), allora è possibile valutare il requisito sui dati «tal quali» di ciascun fattore e condurre così il test tante volte quanti sono i fattori; se i gruppi sono numerosi ed il numero di repliche limitato (questo è il caso generalmente più frequente nel nostro campo), spesso è più conveniente applicare il test di normalità una volta sola su tutti i residui assieme. Test di normalità di Shapiro-Wilk sui residui
Test di omogeneità delle varianze di Levene Varianza omogenea tra i trattamenti La varianza è una stima della credibilità di una media: dati molto variabili, quindi con una varianza ampia, a parità del numero di osservazioni hanno medie meno credibili, proprio perché più variabili (come i loro dati). L’analisi della varianza confronta le medie, è quindi necessario che la loro credibilità sia simile, soprattutto quando i campioni hanno dimensioni molto differenti. Test di omogeneità delle varianze di Levene