Analisi della varianza (a una via) ANOVA Analisi della varianza (a una via) L’analisi della varianza serve a studiare la relazione tra una variabile categoriale (X) e una variabile cardinale (Y): X è in ipotesi indipendente, le sue singole categorie (modalità) si definiscono “gruppi”; Y è in ipotesi dipendente da X. Lo scopo dell’analisi della varianza è testare l’ipotesi che la varianza di Y dipenda da X, o in altre parole che le medie dei gruppi costituiti dalle modalità di X sulla variabile Y siano significativamente differenti. Esempio: formuliamo l’ipotesi che la varianza dello scarto tra il primo ed il secondo test dipenda dal sesso dei soggetti. Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili
L’analisi della varianza verifica l’ipotesi nulla: H0: tutte le medie sono uguali tra di loro Cioè: H0: μ1 =μ2 =...=μK =μ L’ipotesi alternativa è: H1: almeno una media è diversa dalle altre H1: esiste almeno un gruppo k per cui μk ≠ μ L’ipotesi nulla viene rifiutata se c’è almeno un gruppo con una media significativamente diversa da quella di un altro. Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili
Analisi della varianza L’analisi della varianza rientra tra le analisi statistiche inferenziali, cioè mirate a valutare se le evidenze emerse su dati campionari sono estendibili all’intera popolazione da cui è estratto il campione. Perché abbia senso applicare questa analisi devono darsi le seguenti condizioni: Le osservazioni devono essere tra loro indipendenti La variabile dipendente deve avere distribuzione normale Le varianze all’interno degli strati devono essere omogenee (cioè simili tra loro). Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili
La scomposizione della varianza Possiamo scomporre lo scarto dalla media di un singolo valore della distribuzione di Y in due componenti: Lo scarto del valore dalla media del suo gruppo (ad esempio lo scarto del soggetto 25 dalla media delle donne); Lo scarto della media del gruppo dalla media generale (ad esempio lo scarto della media delle donne dalla media generale). Allo stesso modo è possibile scomporre la somma del quadrato degli scarti di tutti i valori dalla media generale, cioè la devianza totale: Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili
La scomposizione della varianza (2) La variabilità totale della variabile dipendente Y è descritta dalla devianza totale (cioè dalla somma dei quadrati degli scarti dalla media). La variabilità nei gruppi (entro i gruppi) è descritta dalla devianza entro i gruppi (cioè dalla somma dei quadrati degli scarti dalla media del gruppo, detta anche somma interna dei quadrati o devianza non spiegata): Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili
La scomposizione della varianza (3) La variabilità fra i gruppi (definiti dalle modalità di X) è descritta dalla devianza tra i gruppi (cioè dalla somma dei quadrati degli scarti tra le medie dei gruppi e la media generale, detta anche somma esterna dei quadrati o devianza spiegata): Devianza spiegata da cosa? … dalla variabile categoriale: è la parte di variabilità della variabile dipendente attribuibile alla variabile dipendente (nell’esempio è la parte della variabilità dello scarto tra primo e secondo test attribuibile al sesso dei soggetti). Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili
La scomposizione della varianza (4) SQesterna=0 in caso di assenza di relazione SQinterna=0 in caso di relazione perfetta Il diverso peso relativo della somma dei quadrati esterna e della somma dei quadrati interna (cioè della devianza spiegata e di quella non spiegata) può essere utilizzato per valutare la significatività e la forza della relazione tra X e Y. Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili
La significatività della relazione: i gradi di libertà Ad ognuna delle devianze sono associati i gradi di libertà: • la devianza totale ha n − 1 gradi di libertà (dove n è la numerosità dei casi) • la devianza tra gruppi ha p − 1 gradi di libertà (dove p è il numero dei gruppi) • la devianza entro i gruppi ha n - p gradi di libertà Dividendo la devianza per i gradi di libertà si ottiene la stima della varianza della popolazione. Varianza entro i gruppi: Varianza tra i gruppi: Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili
La significatività della relazione: il test F Il test F serve a verificare l’ipotesi di uguaglianza delle medie confrontando varianza spiegata e varianza non spiegata: Se l’ipotesi nulla è vera le due stime della varianza sono uguali; se è falsa la stima esterna è maggiore di quella interna. La statistica F ha una distribuzione campionaria conosciuta, segue una distribuzione F di Fisher, cioè si conosce il suo valore critico in base al quale respingere o accettare H0 a seconda dei gradi di libertà delle due stime. Esistono tabelle dei valori critici a seconda della significatività e la regola decisionale è: Rifiuto H0 se F (calcolato) > Fα (tabulato). Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili
La significatività della relazione: il test F I risultati del test F per l’analisi della varianza con una sola variabile indipendente vengono sintetizzati in un’unica tabella dai programmi di analisi, Spss presenta una tabella di questo tipo: Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili
La forza della relazione Il confronto tra le medie dei gruppo può rendere conto della forza della relazione: tanto più le medie differiscono tra loro maggiore sarà la forza della relazione. Esistono però diversi coefficienti per quantificare questa forza, il più semplice è l’eta-quadrato, dato dal rapporto tra la somma dei quadrati esterna (cioè la devianza spiegata) e la somma dei quadrati totale (la devianza totale). Varia tra 0 (assenza di relazione) e 1 (relazione perfetta, tutta la devianza di Y è attribuibile a X) ed è chiamato anche rapporto di correlazione di Pearson. Risente del numero delle categorie della variabile categoriale, quindi si deve fare attenzione nel confrontare eta-quadrati di una stessa Y con X aventi un numero di modalità differenti, inoltre presenta dei problemi se il numero dei casi in ogni gruppo è troppo ridotto. Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili
Il test T Il test T, come l’analisi della varianza, permette di valutare se le differenze nelle medie sono significative oppure dovute al caso, nel caso si abbiano a disposizione due medie, cioè ci interessi confrontare due gruppi. Anche in questo caso siamo nell’ambito della statistica inferenziale, e le assunzioni alla base del test T sono le seguenti: Le osservazioni devono essere tra loro indipendenti La variabile dipendente deve avere distribuzione normale Le varianze all’interno degli strati devono essere uguali. Teoria e pratica della valutazione Laboratorio – Lezione X Analisi della varianza e test su due variabili