La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Disegno del modello di analisi dei dati sperimentali Lezione 3: Analisi della varianza (ANOVA)

Presentazioni simili


Presentazione sul tema: "Disegno del modello di analisi dei dati sperimentali Lezione 3: Analisi della varianza (ANOVA)"— Transcript della presentazione:

1 Disegno del modello di analisi dei dati sperimentali Lezione 3: Analisi della varianza (ANOVA)

2 disegno a blocchi randomizzzati Tutti i trattamenti sono assegnati alle stesse unità sperimentali trattamenti sono assegnati random CDC AAD DBA BCB blocchi (b = 3) trattamenti (a = 4)

3 trattamenti paziente ABCDmedia blocchi (pazienti) trattamenti (Farmaci)

4 trattamenti paziente ABCDmedia media

5 paziente 3 Farm. B

6 Valori Predetti di y

7 trattamenti paziente ABCDmedia media valore osservato di y valore predetto di y

8 Residui e varianza residua

9 varianze e covarianze disegno Orthogonale

10 limiti di confidenza dei parametri al 95% t 0.05,6 = pazienti Farmaci

11 vi sono differenze tra Farmaci ? Differenzastimavarianza A-B A-C A-D B-C B-D C-D Es: B-D: 0.1 < P < 0.2

12 tutte le differenze a coppia DifferenzatP Pat 1 - Pat Pat 1 – Pat Pat 2 – Pat Farm. A – Farm. B Farm. A – Farm. C Farm. A – Farm. D Farm. B – Farm. C Farm. B – Farm. D Farm. C – Farm. D

13 Perchè i confronti a coppia non sono saggi ? i confronti a coppia sono non saggi per due ragioni : (1) Richiedono spesso molte prove (2) Possono aumentare l'errore del di tipo I di rischio, cioè di rifiuto di H 0 anche quando H 0 è vera 2stage.exe

14 Confronti Multipli Se un fattore ha a livelli... Se desideriamo confrontare tutte le differenze possibili tra le medie di s livelli, le prove totali k sono tali che, al paio a, k diventa … a = 2 k = 1 a = 4 k = 6 a = 10 k = 45 a = 20 k = 190

15 Se α = 0.05 per singolo test, allora la probabilità di com- mettere almeno un errore di I° tipo (rigettando H 0 quando essa è vera ) si dimostra essere Probabilità di errore di I° tipo se k = 1 Probabilità di non errore di I° tipo se k =1 Probabilità di non errore di I° tipo se k > 1 Probabilità di slmeno un errore di tipo I a = 2 k = 1 P = 0.05 a = 4 k = 6 P = a = 10 k = 45 P = a = 20 k = 190 P =

16 The Bonferroni adjustment Se we want that P(almeno un errore tipo I) α allora we need to find α so that 1-(1-α) k α α 1 – (1- α) 1/k α/k errore s perimentale a = 4 k = 6 α 1 – ( ) 1/6 = α/k = 0.05/6 = a = 10 k = 45 α 1 – ( ) 1/45 = α/k = 0.05/45 = La correzione di Bonferroni è una soluzione demergenza al problema di test multipli A disadvantage della correzione di Bonferroni è che è conservativa, i.e. it accresce il rischio errore di tipo II (accettando H 0 quando essa è falsa)

17 Question 1: sono presenti differenze tra pazienti ? Question 2: sono presenti differenze tra Farmaci ? modelo completo : blocchi trattamenti La soluzione anova al problema

18 Risposta alla domanda 1 modelo completo : Se vi sono no differenze tra persons allora β 1, e β 2 will both be 0. H 0 : Non differenza tra pazienti β 1 = β 2 = 0 H 1 : pazienti sono differenti Se H 0 è correct allora modelo ridotto :

19 Risposta alla domanda 2 modelo completo : Se non vi sono differenze tra trattamenti allora β 3, β 4, e β 5 will tutte be 0. H 0 : No differenze tra trattamenti β 3 = β 4 = β 5 = 0 H 1 : trattamenti have an effetto Se H 0 è correct allora modelo ridotto :

20 In fine, se nessun trattamento e/o pazienti differisce, abbiamo modelo completo : modelo ridotto :

21 Model 1:df = n-1 =11 Model 2a: df = n-p = 9 df = n-p = 8 Model 2b: Modello C.: df = n-p = 6

22 Test per gli effetti dei Farmaci modelo completo : modelo ridotto : Differenza tra reduced e modelo completo : Se H 0 è vera, allora s 1 2, s 2 2 and s 3 3 will tutte be stime di σ 2 Se H 0 è not vera, allora s 3 2 > σ 2

23 Gradi di libertà per F Since F è the ratio tra s 3 2 con p 2 -p 1 df e s 2 2 con n-p 2 df F has p 2 -p 1 df in the numerator e n-p 2 df in the denominator, i.e. The F-test è one-tailed (only values larger than 1 leads to rejection of H 0 ) MS due to omitting the factor MS dovuta al modello completo

24 variazione Spiegata e non Spiegata variabilità non spiegata per model senza the factor SSE 1 SSE 2 variabilità non spiegata per model con the factor SSE 1 -SSE 2 Explained variation by including the factor = SS(factor)

25 df = n-p = 6 Model 1:df = n-1 =11 Model 2a: df = n-p = 9 Model 2b: df = n-p = 8 modelo completo : Test per effetto dei Farmaci

26 variazione Spiegata e non Spiegata per Farmaci variazione non Spiegata senza Farmaci variazione non Spiegata con Farmaci variazione non Spiegata by Farmaci = SS(Farmaci )

27 Model 1:df = n-1 =11 Model 2: df = n-p = 9 Model 2: df = n-p = 8 modelo completo : df = n-p = 6 Test per effetto dei pazienti

28 variabilità spiegata e non spiegata per pazienti variabilità non spiegata senza pazienti variabilità non spiegata con pazienti variabilità spiegata dai pazienti = SS(pazienti )

29 Somma dei quadrati (SS) variazione Totale = Variazione dovuta ai pazienti + Variazione dovuta ai Farmaci + variazione non spiegata variabilità spiegata dal modello SS (total) = SS (modello) + SS (residual) = SS (pazienti) + SS (Farmaci) + SSE

30 Analisi della varianza SourceSSdfMSFP pazienti Farmaci Error SS (pat) SS (Farmaci ) SSE b-1 a-1 n-a-b+1 SS(pat)/(b-1) SS(Farmaci)/(a -1) SSE/(n-a-b+1) MS(pat)/s 2 MS(FarmacI)/ s 2 TotalSS (total)n-1

31 SourceSSdfMSFP pazienti Farmaci Error SS (pat) SS (Farmaci ) SSE b-1 a-1 n-a-b+1 SS(pat)/(b-1) SS(Farmaci )/(a-1) SSE/(n-a-b+1) MS(pat)/s 2 MS(Farmaci )/s 2 TotalSS (total)n-1 SourceSSdfMSFP Model pazienti Farmaci Error Total ** ***

32 SourceSSdfMSFP Model pazienti Error Total ***

33 Orthogonal disegno s

34 Disegno Orthogonale A multifactorial experiment è said to be orthogonal se the stime di the parameters associated con each factor sono independent of each other SS(total) = SS 1 +SS SS k + SSE An experiment è orthogonal se each level di one factor occurs the same number di times as the number levels di the second factor, e if this applies to tutte the factors. Se an experiment è not orthogonal, allora the parameters will change each time a factor è removed from the model, e SS depends on the order in which factors sono included in the model

35 How to do it con SAS

36 DATA eks5_1; /* eksempel 5.1 i G. Nachman: Forsøgsplanlægning og statistisk analyse af eksperimentelle data */ /* Programmet udfører en to-sidet variansanalyse med paziente og behandling som faktorer. disegno et er fuldstændigt faktorielt */ /* Bemærk at behandling er en systematisk faktor, mens pazienteer er tilfældig */ /* Analysen forudsætter, at der ikke er interaktion imellem medikament og paziente */ INPUT pat $ treat $ y; /* indlæser data */ /* pat = paziente (kvalitativ variabel) treat = behandling (kvalitativ variabel y = response (kvantitativ variabel) */ CARDS; /* her kommer data. Kan også indlæses fra en fil */ 1 A A A B B B C C C D D D 4.61 ; PROC GLM; /* procedure General Linear Models */ TITLE 'Eksempel 5.1'; /* medtages hvis der ønskes en titel */ CLASS pat treat; /* pat og treat er klasse (kvalitative) variable */ MODEL y = pat treat / CLM SOLUTION; /* modellen forudsætter at y afhænger af paziente og behandling */ /* CLM er en option som giver sikkerhedsgrænserne omkring middelværdien per en given kombination af paziente og behandling */ /* SOLUTION udprinter parameterstimarne */ OUTPUT OUT=new P = pred R= res; /* OUTPUT laver et nyt datasæt kaldet new. Det indeholder variablen pred og res, som er de predikterede værdier og residualerne */ /* Test parvise forskelle mellem behandlinger */ CONTRAST 'A versus B' Treat ; CONTRAST 'A versus C' Treat ; CONTRAST 'A versus D' Treat ; CONTRAST 'B versus C' Treat ; CONTRAST 'B versus D' Treat ; CONTRAST 'C versus D' Treat ; RUN; PROC PLOT DATA=new; /* plotter procedure */ TITLE 'Eksempel 5.1'; /* titel */ TITLE 'residual plottet mod predikterede værdier'; /* titel per plot */ PLOT res*pred = '*'; /* res plottes mod pred med * som symbol */ RUN; PROC UNIVARIATE FREQ PLOT NORMAL DATA=new; /* PROC UNIVARIATE giver information om den eller de variable, der defineres i VAR linien nedenfor. */ /* FREQ, PLOT, NORMAL osv. er options FREQ = antal observationer af en given værdi PLOT = plot af observationerne NORMAL = test per normalfordeling */ TITLE 'Eksempel 5.1'; /* titel */ VAR res; /* informationer om variablen res */ RUN; DATA eks5_1; /* eksempel 5.1 i G. Nachman: Forsøgsplanlægning og statistisk analyse af eksperimentelle data */ /* Programmet udfører en to-sidet variansanalyse med paziente og behandling som faktorer. disegno et er fuldstændigt faktorielt */ /* Analysen forudsætter, at der ikke er interaktion imellem medikament og paziente */ INPUT pat $ treat $ y; /* indlæser data */ /* pat = paziente (kvalitativ variabel) treat = behandling (kvalitativ variabel y = response (kvantitativ variabel) */ CARDS; /* her kommer data. Kan også indlæses fra en fil */ 1 A A A B B B C C C D D D 4.61 ;

37 PROC GLM; /* procedure General Linear Models */ TITLE 'Eksempel 5.1'; /* medtages hvis der ønskes en titel */ CLASS pat treat; /* pat og treat er klasse (kvalitative) variable */ MODEL y = pat treat / CLM SOLUTION; /* modellen forudsætter at y afhænger af paziente og behandling */ /* CLM er en option som giver sikkerhedsgrænserne omkring middelværdien per en given kombination af paziente og behandling */ /* SOLUTION udprinter parameterstimarne */ OUTPUT OUT=new P = pred R= res; /* OUTPUT laver et nyt datasæt kaldet new. Det indeholder variablen pred og res, som er de predikterede værdier og residualerne */ RUN;

38 Eksempel :18 Monday, November 5, 2001 General Linear Models Procedure Class Level Information Class Levels Values PAT TREAT 4 A B C D Number di observations in data set = 12

39 Eksempel :18 Monday, November 5, 2001 General Linear Models Procedure Dependent Variable: Y Source DF Sum di Squares Mean Square F Value Pr > F Model Error Corrected Total R-Square C.V. Root MSE Y Mean Source DF tipo I SS Mean Square F Value Pr > F PAT TREAT Source DF tipo III SS Mean Square F Value Pr > F PAT TREAT Globale significatività di the model Explained variationpazienti sono significativamente different Farmaci sono not significativamente different

40 T per H0: Pr > |T| Std Error of Parameter stima Parameter=0 stima INTERCEPT B PAT B B B... TREAT A B B B C B D B... NOTE: The X'X matrix has been found to be singular e a generalized inverse was used to solve the normal equations. stime followed by the letter 'B' sono biased, e sono not unique estimators di the parameters.


Scaricare ppt "Disegno del modello di analisi dei dati sperimentali Lezione 3: Analisi della varianza (ANOVA)"

Presentazioni simili


Annunci Google