L’Analisi della Varianza ANOVA (ANalysis Of VAriance)

Slides:



Advertisements
Presentazioni simili
L’Analisi della Varianza ANOVA (ANalysis Of VAriance)
Advertisements

Analisi della varianza (a una via)
Analisi della varianza
Test dell’ ANOVA L EZIONI III PARTE F ONDAMENTI E METODI PER L ’ ANALISI EMPIRICA NELLE SCIENZE SOCIALI A. A
INTRODUZIONE ALL’ANALISI DELLA VARIANZA
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
1 Principali analisi statistiche 1. Confronto fra medie (2 o piú campioni) 2. Correlazione e regressione 3. Analisi di tabelle di contigenza Variabile.
Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione.
I Polinomi Prof.ssa A.Comis.
Rappresentazioni grafiche di una distribuzione di frequenze 1)Istogramma e poligono delle frequenze ● Dati raggruppati in classi ● Costituito da un insieme.
Analisi della varianza
Genetica delle Popolazioni a.a prof S. Presciuttini DIMENSIONE EFFETTIVA DELLA POPOLAZIONE Questo documento è pubblicato sotto licenza Creative.
Corso di Analisi Statistica per le imprese
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
Precorso di Statistica per le Lauree Magistrali
LA STATISTICA DESCRITTIVA
Precorso di Statistica
Corso di Analisi Statistica per le Imprese Cross tabulation e relazioni tra variabili Prof. L. Neri a.a
RICHIAMI DI INFERENZA:
STATISTICA Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo.
Corso di Analisi Statistica per le Imprese Indici di variabilità ed eterogeneità Prof. L. Neri a.a
L’analisi monovariata
Misure Meccaniche e Termiche - Università di Cassino
Metodi Quantitativi per Economia, Finanza e Management Lezione n°12 Regressione Logistica: Le ipotesi del modello, la stima del modello.
Confronto fra 2 popolazioni
L’analisi della varianza:
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Quantitative Market Research Set-up Protocol
PIANIFICAZIONE DEI TRASPORTI Regressione lineare
APPUNTI DI STATISTICA INFERENZIALE
Intervalli di Fiducia Introduzione Intervalli di fiducia per la media – Caso varianza nota Intervalli di fiducia per la media – Caso varianza non nota.
Precorso di Statistica
Accenni di analisi monovariata e bivariata
Precorso di Statistica per le Lauree Magistrali
IL MODELLO DI REGRESSIONE LINEARE
La Statistica Istituto Comprensivo “ M. G. Cutuli”
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Statistica descrittiva bivariata
L’analisi monovariata
Algebra di Boole e sue applicazioni
L’indagine statistica
Statistica Scienza che studia i fenomeni collettivi.
Quantitative Market Research Set-up Protocol
La distribuzione campionaria: principi generali
Statistica descrittiva bivariata
Statistica descrittiva bivariata
ANALISI DI REGRESSIONE
Statistica inferenziale
Test per campioni appaiati
Esercizio La popolazione di adulti presenta una media di ansia pari a 4. Ad un campione di 35 soggetti con disturbo ossessivo compulsivo è stato somministrato.
Distribuzioni Bivariate
Esercizio 2 Un gruppo di persone con DCA ha partecipato per tre mesi ad una psicoterapia di gruppo per aumentare la propria autostima. Verificare che la.
Precorso di Statistica per le Lauree Magistrali
Corso di Analisi Statistica per le imprese
Precorso di Statistica
RICHIAMI DI INFERENZA:
Esercizio 1 Il voto medio della popolazione degli studenti della Lumsa al primo esonero di psicometria è pari a 26 (σ=3). Gli studenti hanno sempre svolto.
RICHIAMI DI INFERENZA:
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9
Associazione tra due variabili
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Corso di Analisi Statistica per le Imprese
Test per campioni indipendenti
Associazione tra variabili qualitative
Corso di Analisi Statistica per le Imprese
Statistica e probabilità Università degli Studi di Sassari Facoltà di Medicina veterinaria Corso di Laurea in Medicina veterinaria Anno Accademico 2017/2018.
Statistica descrittiva bivariata
Analisi Univariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°3.
Transcript della presentazione:

L’Analisi della Varianza ANOVA (ANalysis Of VAriance)

Concetti generali (1/3): Confronto simultaneo tra più di due popolazioni, esempi..... La analisi della varianza estende il confronto a p gruppi con p>2.

Concetti generali (2/3) Fattore: variabile utilizzata per differenziare un gruppo da un altro gruppo. Livello (o trattamento): uno dei possibili valori/stati/caratteristiche che il fattore può assumere Variabile risposta: variabile quantitativa oggetto dello studio Esempio: Si vuole verificare se la razza dei vitelli (FATTORE) considerando tre razze (LIVELLI) influenza il peso (VARIABILE RISPOSTA) di 20 vitelli : bovini Razza 1 Razza 2 Razza 3 1 63,3 72,8 82,3 2 ... ..... 20

Il disegno completamente randomizzato E’ il disegno sperimentale più semplice Si utilizza quando si considera un solo fattore sperimentale a più livelli. I trattamenti/livelli sono assegnati alle unità sperimentali in modo casuale (randomizzazione). Se il numero di repliche è uguale per tutti i trattamenti il disegno è detto bilanciato (preferibile), altrimenti è detto sbilanciato.

Concetti generali (3/3) In genere i livelli o gruppi possono essere non solo numerici ma anche qualitativi. I fattori che definiscono i gruppi possono essere più di uno. Con un solo fattore  analisi della varianza ad un fattore o ad una via Con due (o più) fattori  analisi della varianza a due ( o più) fattori o a due vie (o più vie)

Predisposizione dei dati Fattore repliche 1 2 ..... i .... p y11 y21 yi1 yp1 y12 y22 yi2 yp2 ... J y1j y2j yij ypj ni Y1n (i) Y2n(i) Yin(i) Ypn(i) Medie

ESEMPIO: peso di 20 vitelli

Il modello lineare:

Il modello lineare Il modello può essere rappresentato in questa forma: Yij =  + αi + εij con μ media di tutte le popolazioni rappresentate nell’esperimento αi = μ − μi effetto dell’i-esimo trattamento/livello Generalmente si assume: i = 1, . . . , p (p numero dei livelli) j = 1, . . . , ni (ni numero di repliche all’interno di un livello) nt= n.ro totale di osservazioni Se il disegno è bilanciato, n1 = n2 = . . . = np

IDEA DI FONDO: Scomposizione della variabilità totale Variabilità all’interno dei gruppi (SSE)  errore sperimentale Variabilità tra i gruppi (SSA)  effetti del trattamento/livello Si ha che: SST = SSA + SSE

Come fare inferenza Assumendo che i p gruppi (popolazioni) da cui vengono estratte casualmente le osservazioni siano distribuiti normalmente e abbiano uguali varianze, l’ipotesi sottoposta a verifica è: H0: m1 = m2 = … = mp oppure H0 : αi= 0 HA: non tutte le mi sono uguali

Come costruire il test? Il test è basato sulle seguenti considerazioni: Se è vera l’ipotesi nulla, i dati differiscono tra loro per il solo effetto della variabilità casuale. Se invece è vera l’ipotesi alternativa (quindi rifiuto l’H0), entrambe le fonti di variabilità contribuiscono a determinare la variabilità complessiva. Il test è quindi basato sull’analisi della variabilità complessiva in funzione delle diverse cause (da cui il termine Analisi della Varianza).

La VARIABILITA’ TOTALE è descritta dalla SST: Devianza totale: Scomposizione della variabilità totale La VARIABILITA’ TOTALE è descritta dalla SST: Devianza totale:

Scomposizione della variabilità totale La VARIABILITA’ TRA I GRUPPI è descritta dalla SSA (devianza tra i gruppi) Devianza tra i gruppi: FORMULA CALCOLATORIA:

Scomposizione della variabilità totale La VARIABILITA’ NEI GRUPPI (o ENTRO I GRUPPI) è descritta dalla SSE: devianza entro i gruppi Devianza entro i gruppi: FORMULA CALCOLATORIA

Cosa ci aspettiamo? Se l’ipotesi nulla è vera, ci possiamo attendere uno scarso contributo della devianza tra gruppi alla devianza totale. Sell’ipotesi nulla è falsa, ci possiamo attendere che entrambe le devianze contribuiscano a determinare la devianza totale. A questo livello non è però possibile fare confronti, perchè le devianze hanno un numero di addendi diverso. Dobbiamo quindi rendere confrontabili le devianze....

I gradi di libertà Ad ognuna delle devianze sono associati i gradi di libertà: • la devianza totale ha nt − 1 gradi di libertà • la devianza tra gruppi ha p − 1 gradi di libertà • la devianza entro i gruppi ha nt - p gradi di libertà Dividendo ciascuna devianza per i rispettivi gradi di libertà si ottengono le VARIANZE, cioè le medie dei quadrati: Varianza tra i gruppi Varianza entro i gruppi

Test F per la ANOVA a un fattore Per verificare l’ipotesi di uguaglianza delle medie utilizzo il test F che confronta MSA e MSE. Il test F segue una distribuzione F di Fisher con (p-1, nt-p) gradi di libertà. La regola decisionale è: Rifiuto H0 se F>Fα

Test F per la ANOVA a un fattore Il valore critico della F viene determinato in funzione del livello di significatività a del test. I valori critici si individuano nelle tavole della distribuzione F in base ai gradi di libertà e al livello di significatività scelto Se H0 è falsa ci aspettiamo che F assuma valori maggiori rispetto ai valori tabulati nella tavola della F  la variabilità totale è dovuta soprattutto all’effetto del trattamento/fattore. Se H0 è vera ci aspettiamo che il valore osservato di F sia minore al valore tabulato.

Test F per la ANOVA a un fattore I risultati del test F per la ANOVA a un fattore vengono sintetizzati in una tabella come quella seguente:

Esempio Esempio:Peso dei vitelli di 3 razze diverse: Output di excel: