La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

ANALISI DELLA VARIANZA (ANOVA)

Presentazioni simili


Presentazione sul tema: "ANALISI DELLA VARIANZA (ANOVA)"— Transcript della presentazione:

1 ANALISI DELLA VARIANZA (ANOVA)
E’ UNA TECNICA STATISTICA NATA NELL’AMBITO DELLA RICERCA SPERIMENTALE PER VALUTARE L’EFFETTO DI DETERMINATI FATTORI, VARIABILI INDIPENDENTI -DI TIPO CONTINUO O CATEGORIALE , SULLA VARIABILE DIPENDENTE -DI TIPO CONTINUO-.

2 ES. SE CONFRONTIAMO L’EFFETTO DI UN NUOVO FARMACO NELLA CURA DELLA DEPRESSIONE VERSO L’EFFETTO DI UN FARMACO STANDARD (CONFRONTO DI 2 GRUPPI), USIAMO IL TEST T DI STUDENT; IMPLEMENTIAMO UN’ANOVA QUANDO IL CONFRONTO E’ FATTO SU + DI 2 GRUPPI.

3 SE PERO’ SI VUOLE TENER CONTO ANCHE
DEL FATTO CHE I PAZIENTI PROVENGONO DA 2 O + CLINICHE DIVERSE E CHE QUINDI L’AZIONE COMBINATA DEL TIPO DI OSPEDALE E TIPO DI FARMACO PUO’ CONGIUNTAMENTE INFLUENZARE L’ESITO DELLA CURA, ALLORA RICORRIAMO ALL’ANALISI DELLA VARIANZA A + FATTORI.

4 L’ANALISI DELLA VARIANZA ASSUME NOMI DIVERSI A SECONDA DI QUANTE SONO LE VARIABILI DIPENDENTI E INDIPENDENTI. ANOVA AD UNA VIA (ONE-WAY) QUANDO SI HA UNA SOLA VARIABILE DIPENDENTE E UNA SOLA VARIABILE INDIPENDENTE. ANOVA FATTORIALE QUANDO SI HA UNA SOLA VARIABILE DIPENDENTE, MA PIU’ VARIABILI INDIPENDENTI. MANOVA (MULTIVARIATE ANALYSIS OF VARIANCE) QUANDO C’E’ + DI UNA DIPENDENTE E + DI UNA INDIPENDENTE.

5 IL CONFRONTO TRA CAMPIONI CON A=nalysis N O=f V=ariance A
A UNA VIA (ONE-WAY) Siano dati p campioni di uguale numerosità n (MODELLO BILANCIATO) : si misuri la grandezza x considerando la media e la deviazione standard su ciascun campione C1: xm1 ± s1 C2: xm2 ± s2 ……………….. Cp: xmp ± sp

6 Qual è la logica dell’ANOVA?
O meglio quali ipotesi sono sottoposte a verifica e quale ragionamento porta all’accettazione o al rifiuto di esse? Nell’ANOVA le ipotesi sono: H0 : 1= 2=... p H1: almeno due delle medie sono tra loro differenti Facciamo inferenza sulle medie, ma lavoriamo sulla scomposizione della varianza.

7 Per controllare l’effetto dei diversi livelli di trattamento,
ossia per testare la differenza tra le medie dei gruppi sottoposti ai diversi livelli di trattamento, separiamo la variabilità complessiva della variabile dipendente in due fonti di variabilità: * una attribuibile al trattamento varianza tra gruppi o varianza between * una residua all’interno dei gruppi varianza entro i gruppi o within. Dal confronto delle due varianze possiamo decidere se i trattamenti diversi hanno avuto effetto oppure no.

8 In pratica: 1) Poiché posso conoscere la varianza della media campionaria, per il teorema fondamentale che afferma che m=(xm1+xm2+..xmp)/p; sxm=s/sqrt(n) s2tra=((xm1- m)2+(xm2- m)2+..+.(xm2- m)2/(p-1) (VARIANZA BETWEEN) 2) Poiché i campioni provengono dalla stessa popolazione, posso pensare di prendere la media delle varianze dei campioni: s2entro= (s12+s22+……sp2)/p (VARIANZA WITHIN)

9 TEOREMA DI SCOMPOSIZIONE DELLA VARIANZA
varianza totale=varianza tra gruppi + varianza residua varianza totale=   (yik-y)2 N-1 varianza between= n  (y.k-y)2 K-1 varianza within=   (yik-y.k)2 N-k Se l’ipotesi nulla è vera le due stime della varianza avranno lo stesso valore atteso della varianza della popolazione, quindi il rapporto tra la varianza tra i gruppi e la varianza entro i gruppi ha come valore atteso 1 se l’ipotesi nulla è vera, in caso contrario un valore >1.

10 E’ stato dimostrato che la variabile
F=n s2b/s2w è distribuita secondo la legge di Fisher, ed è possibile valutare la probabilità associata ai valori di F noti i gradi di libertà del numeratore: p-1 del denominatore: p(n-1)

11 Il rapporto tra varianza between e varianza within è il test F di Fisher.
F=VARB/VARW Questo test ha una distribuzione campionaria F di Snedecor, per un valore  prefissato, solitamente =0.05, questo test ci dice quando l’ipotesi nulla è accettata (<0.05) e quando viene rifiutata (>0.05). Il test F è la principale diagnostica dell’ANOVA, ci dice se almeno due medie sono statisticamente diverse. Se vogliamo sapere quali delle medie sono diverse usiamo delle correzioni per i confronti multipli, ovvero facciamo dei test t tra le coppie delle medie. Vengono applicate delle correzioni sul livello di significatività per il fatto che sono fatti + confronti sugli stessi dati. Confronti multipli di Bonferroni *= /p

12 Il test t e l’analisi della varianza sono la stessa cosa?
Nel confronto delle medie di 2 gruppi, F=t2, perciò test t e analisi della varianza sono 2 modi per fare la stessa cosa. In particolare il test t è un caso speciale di analisi della varianza applicata a 2 gruppi.

13 Rivediamo l’esempio dell’alotano e della morfina:
alotano: n=61 xmalo=66.9 mmHg salo=12.2 mmHg morfina: n=61 xmorf=73.2 mmHg smorf=14.4 mmHg s2entro=((12.2)2+(14.4)2)/2=178.1 m=(xmalo+xmorf)/2=( )/2=70 s2tra=(xmalo- m)2 +(xmorf- m)2=…....=19.85 quindi: F= /178.1 =6.8 n num=2-1=1 n den=2(61-1)=120 il valore critico al 5% è F*=3.92<F .Rifiuto l’ipotesi nulla la morfina è più efficace.

14 Altro esempio: effetto della corsa sui disturbi mestruali. Si sono confrontati 3 gruppi di 26 donne: controllo: mestr/anno SD= 1.3 joggers runners s with2 = ( )/3 = 3.95 Xm = ( )/3 = 10.2 s bet2 = n Sm =26(1.2)2 = 37.4

15 In definitiva: F = 37.4/3.95 = 9.48 g l num = 3-1=2, g l den = 3 ( 26-1) = 75 consultando le tabelle: P < 0.01: la corsa altera il ciclo mestruale. Confronti ‘incrociati’ : vi sono vari metodi. Uno dei più usati è il test t di Bonferroni: Pb = P / (0.5 p (p-1)) p= numero gruppi

16 Confronto controllo-joggers:
t = ( )/sqrt(2 3.95/26) = -2.54 confronto controllo-runners: t = ( )/ sqrt(2 3.95/26) = -4.35 confronto joggers-runners: t = ( )/sqrt(2 3.95/26) = 1.81 poiché abbiamo 3 casi, dovremo considerare P = 5%/3 = 1.6 % e 75 gradi di libertà. Il valore critico di t risulta circa 2.47. I primi due casi sono significativi!!!

17 Altri confronti incrociati possono essere eseguiti con:
-LSD - Scheffè - Tukey - B-Tukey - S-N-K -Duncan - REGW

18 IL CONFRONTO TRA CAMPIONI CON A=nalysis N O=f V=ariance A
A DUE VIE (TWO-WAYS) In generale è necessario un pacchetto statistico più articolato ( es Winstat)

19 Quando ogni modalità della variabile presenta lo stesso numero di casi si parla di disegno bilanciato. n1=n2=…nk

20 Occorre qualche cautela nell’impostare i dati sul foglio di lavoro:
vedere esempi. Si noti che le variabili indipendenti possono essere sia continue sia categoriali. E’ allora buona norma, in prospettiva di una analisi statistica a posteriori, caratterizzare i dati con TUTTE le informazioni disponibili per valutarne l’eventuale incidenza. (es: classi di età, sesso, provenienza,…)

21

22 Infine, per quanto riguarda il MANOVA (analisi multivariata che
correla più variabili dipendenti con più variabili indipendenti), trattandosi di una disegno statistico complesso, occorre ricorrere a risorse di programmazione: SAS

23


Scaricare ppt "ANALISI DELLA VARIANZA (ANOVA)"

Presentazioni simili


Annunci Google