ANALISI DELLA VARIANZA STATISTICA 6.0: ANALISI DELLA VARIANZA Obiettivi della lezione: A Introduzione all’Analisi della Varianza con il software STATISTICA 6.0 B Passi principali per l’esecuzione della procedura C Esempi
A Analisi della Varianza Si vogliono paragonare diverse popolazioni utilizzando l’Analisi della varianza (ANOVA) Consideriamo il caso di analisi della Varianza a 1 via. Siamo interessati a paragonare le medie di k popolazioni: Abbiamo k popolazioni tutte identificate da alcune caratteristiche comuni che devono essere studiate nell’esperimento. Campioni indipendenti di taglia sono estratti rispettivamente da ognuna delle k popolazioni. Differenze osservate nell’Analisi sono da imputarsi a differenze tra le k popolazioni Abbiamo N unità sperimentali omogenee e si vogliono studiare gli effetti di k diversi trattamenti. Tali unità sono suddivise in modo aleatorio in k sottogruppi di taglia e ogni sottogruppo riceve un trattamento sperimentale diverso. I k sottogruppi sono intesi come campioni aleatori indipendenti di taglia estratti da k popolazioni.
Quantità coinvolte: Totale della risposta all’i_esimo trattamento Media campionaria dell’i_esimo trattamento
Media del campione totale, costituito dall’unione di tutti i campioni Scarto tra la media relativa a un trattamento e quella del campione totale. (E’ nulla se tutte le medie sono uguali!) Somma degli scarti al quadrato per ogni gruppo di trattamenti
Tabella ANOVA MSW/MSA è ~1 se vera è >>1 se vera Fonte della variazione Sum of squares Gradi di libertà Mean square F(k-1, N-k) Treatment SSW (SS(Tr)) k-1 MSW=SSW/(k-1) MSW/MSA Error SSA (SSE) N-k MSA=SSA/(N-k) Totale SST N-1 MSW/MSA è ~1 se vera è >>1 se vera
B Procedura: inserimento dati e opzioni Esempio: irisdat.sta Statistiche -----> ANOVA ANOVA a una via Variabile dipendente Variabile indipendente Se non voglio considerare tutti i campioni disponibili. Definisce il valore di k
Dà il risultato dell’analisi Tabella ANOVA Rifiuto Livello di significatività Dà il grafico delle medie
Per testare l’ipotesi di normalità dei campioni: Tutti gli effetti: dà il risultato dell’analisi. Se è evidenziato in rosso è perchè rifiuto l’ipotesi nulla di uguaglianza delle medie Tra le opzioni posso modificare il livello di significatività (default: 0.05) Per testare l’ipotesi di normalità dei campioni: Grafici : Grafici Grafici categorizzati Normal probability plot Ottengo il normal probability plot per ogni campione. La varianza si legge come pendenza delle rette
METODO ALTERNATIVO: L’analisi ANOVA a una via si puo’ condurre seguendo la seguente sintassi Statistiche Statistiche di BaseTabelle Segmentazione e ANOVA a 1 via Medie Grafico delle medie Risultato ANOVA
Permette di verificare direttamente la normalità dei campioni mediante il Normal probability plot
Esercizio Si vogliono confrontare le emissioni di CO in 5 modelli diversi di automobili. Per questo scopo si effettuano delle misurazioni su 4 auto per ciascun modello e si ottengono i seguenti risultati: Modello CO (ppm) 1 102, 92, 100, 90 2 92, 88, 96, 82 3 83, 80, 85, 90 4 72, 70, 66, 72 5 86, 88, 90, 84 Testare al livello di significatività l’ipotesi che le emissioni di CO siano uguali nei 5 modelli.
Esercizio Si vogliono confrontare tra loro 4 tipi di fertilizzanti. Per questo scopo vengono considerate 5 diverse coltura, una, detta di controllo, in cui non viene utilizzato alcun fertilizzante e 4 trattate con i fertilizzanti A, B, C e D. Dopo un certo numero di settimane viene misurata la crescita delle piante seminate e si registrano i seguenti dati (in mm.) Gruppo controllo A B C D 75 57 64 86 74 67 58 64.5 87.9 66 66.2 61.3 85 65.2 69.4 55.4 84.6 68 73.2 57.2 63 88 72.1 71 65.5 87.5 70 72.5 60 63.9 86.5 70.3 59 66.3 87 69 64.2 67.4 57.5 85.5 66.5 Testare al livello di significatività l’ipotesi che ci sia differenza tra i 4 fertilizzanti