La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Disegno del modello di analisi dei dati sperimentali Lezione 3: Analisi della varianza (ANOVA)

Presentazioni simili


Presentazione sul tema: "Disegno del modello di analisi dei dati sperimentali Lezione 3: Analisi della varianza (ANOVA)"— Transcript della presentazione:

1 Disegno del modello di analisi dei dati sperimentali Lezione 3: Analisi della varianza (ANOVA)

2 disegno a blocchi randomizzzati Tutti i trattamenti sono assegnati alle stesse unità sperimentali trattamenti sono assegnati random CDC AAD DBA BCB blocchi (b = 3) trattamenti (a = 4)

3 trattamenti paziente ABCDmedia 1 2 3 blocchi (pazienti) trattamenti (Farmaci)

4 trattamenti paziente ABCDmedia 15.175.214.914.745.008 26.237.346.186.316.515 34.934.554.644.614.683 media5.4435.7005.2435.2205.402

5 paziente 3 Farm. B

6 Valori Predetti di y

7 trattamenti paziente ABCDmedia 15.17 5.049 5.21 5.306 4.91 4.849 4.74 4.826 5.008 26.23 6.557 7.34 6.813 6.18 6.357 6.31 6.333 6.515 34.93 4.724 4.55 4.981 4.64 4.524 4.61 4.501 4.683 media5.443 5.700 5.243 5.220 5.402 valore osservato di y valore predetto di y

8 Residui e varianza residua

9 varianze e covarianze disegno Orthogonale

10 limiti di confidenza dei parametri al 95% t 0.05,6 = 2.447 pazienti Farmaci

11 vi sono differenze tra Farmaci ? Differenzastimavarianza A-B A-C A-D B-C B-D C-D Es: B-D: 0.1 < P < 0.2

12 tutte le differenze a coppia DifferenzatP Pat 1 - Pat 26.2240.0008 Pat 1 – Pat 31.3420.2282 Pat 2 – Pat 37.5660.0003 Farm. A – Farm. B0.9180.3942 Farm. A – Farm. C0.7150.5014 Farm. A – Farm. D0.7990.4550 Farm. B – Farm. C1.6440.1536 Farm. B – Farm. D1.7160.1369 Farm. C – Farm. D0.0830.9362

13 Perchè i confronti a coppia non sono saggi ? i confronti a coppia sono non saggi per due ragioni : (1) Richiedono spesso molte prove (2) Possono aumentare l'errore del di tipo I di rischio, cioè di rifiuto di H 0 anche quando H 0 è vera 2stage.exe

14 Confronti Multipli Se un fattore ha a livelli... Se desideriamo confrontare tutte le differenze possibili tra le medie di s livelli, le prove totali k sono tali che, al paio a, k diventa … a = 2 k = 1 a = 4 k = 6 a = 10 k = 45 a = 20 k = 190

15 Se α = 0.05 per singolo test, allora la probabilità di com- mettere almeno un errore di I° tipo (rigettando H 0 quando essa è vera ) si dimostra essere Probabilità di errore di I° tipo se k = 1 Probabilità di non errore di I° tipo se k =1 Probabilità di non errore di I° tipo se k > 1 Probabilità di slmeno un errore di tipo I a = 2 k = 1 P = 0.05 a = 4 k = 6 P = 0.265 a = 10 k = 45 P = 0.901 a = 20 k = 190 P = 0.9999

16 The Bonferroni adjustment Se we want that P(almeno un errore tipo I) α allora we need to find α so that 1-(1-α) k α α 1 – (1- α) 1/k α/k errore s perimentale a = 4 k = 6 α 1 – (1- 0.05) 1/6 = 0.00851 α/k = 0.05/6 = 0.00833 a = 10 k = 45 α 1 – (1- 0.05) 1/45 = 0.00114 α/k = 0.05/45 = 0.00111 La correzione di Bonferroni è una soluzione demergenza al problema di test multipli A disadvantage della correzione di Bonferroni è che è conservativa, i.e. it accresce il rischio errore di tipo II (accettando H 0 quando essa è falsa)

17 Question 1: sono presenti differenze tra pazienti ? Question 2: sono presenti differenze tra Farmaci ? modelo completo : blocchi trattamenti La soluzione anova al problema

18 Risposta alla domanda 1 modelo completo : Se vi sono no differenze tra persons allora β 1, e β 2 will both be 0. H 0 : Non differenza tra pazienti β 1 = β 2 = 0 H 1 : pazienti sono differenti Se H 0 è correct allora modelo ridotto :

19 Risposta alla domanda 2 modelo completo : Se non vi sono differenze tra trattamenti allora β 3, β 4, e β 5 will tutte be 0. H 0 : No differenze tra trattamenti β 3 = β 4 = β 5 = 0 H 1 : trattamenti have an effetto Se H 0 è correct allora modelo ridotto :

20 In fine, se nessun trattamento e/o pazienti differisce, abbiamo modelo completo : modelo ridotto :

21 Model 1:df = n-1 =11 Model 2a: df = n-p = 9 df = n-p = 8 Model 2b: Modello C.: df = n-p = 6

22 Test per gli effetti dei Farmaci modelo completo : modelo ridotto : Differenza tra reduced e modelo completo : Se H 0 è vera, allora s 1 2, s 2 2 and s 3 3 will tutte be stime di σ 2 Se H 0 è not vera, allora s 3 2 > σ 2

23 Gradi di libertà per F Since F è the ratio tra s 3 2 con p 2 -p 1 df e s 2 2 con n-p 2 df F has p 2 -p 1 df in the numerator e n-p 2 df in the denominator, i.e. The F-test è one-tailed (only values larger than 1 leads to rejection of H 0 ) MS due to omitting the factor MS dovuta al modello completo

24 variazione Spiegata e non Spiegata variabilità non spiegata per model senza the factor SSE 1 SSE 2 variabilità non spiegata per model con the factor SSE 1 -SSE 2 Explained variation by including the factor = SS(factor)

25 df = n-p = 6 Model 1:df = n-1 =11 Model 2a: df = n-p = 9 Model 2b: df = n-p = 8 modelo completo : Test per effetto dei Farmaci

26 variazione Spiegata e non Spiegata per Farmaci 1.151 variazione non Spiegata senza Farmaci 0.704 variazione non Spiegata con Farmaci variazione non Spiegata by Farmaci 0.447 = SS(Farmaci )

27 Model 1:df = n-1 =11 Model 2: df = n-p = 9 Model 2: df = n-p = 8 modelo completo : df = n-p = 6 Test per effetto dei pazienti

28 variabilità spiegata e non spiegata per pazienti 8.352 variabilità non spiegata senza pazienti 0.704 variabilità non spiegata con pazienti variabilità spiegata dai pazienti 7.648 = SS(pazienti )

29 Somma dei quadrati (SS) variazione Totale = Variazione dovuta ai pazienti + Variazione dovuta ai Farmaci + variazione non spiegata variabilità spiegata dal modello SS (total) = SS (modello) + SS (residual) = SS (pazienti) + SS (Farmaci) + SSE

30 Analisi della varianza SourceSSdfMSFP pazienti Farmaci Error SS (pat) SS (Farmaci ) SSE b-1 a-1 n-a-b+1 SS(pat)/(b-1) SS(Farmaci)/(a -1) SSE/(n-a-b+1) MS(pat)/s 2 MS(FarmacI)/ s 2 TotalSS (total)n-1

31 SourceSSdfMSFP pazienti Farmaci Error SS (pat) SS (Farmaci ) SSE b-1 a-1 n-a-b+1 SS(pat)/(b-1) SS(Farmaci )/(a-1) SSE/(n-a-b+1) MS(pat)/s 2 MS(Farmaci )/s 2 TotalSS (total)n-1 SourceSSdfMSFP Model8.09551.61913.8380.003 pazienti Farmaci Error 7.648 0.447 0.704 236236 3.824 0.149 0.117 32.68 1.27 0.0006 0.366 Total8.79911 ** ***

32 SourceSSdfMSFP Model7.64823.82429.920.0001 pazienti Error 7.648 1.151 2929 3.824 0.128 29.920.0001 Total8.79911 ***

33 Orthogonal disegno s

34 Disegno Orthogonale A multifactorial experiment è said to be orthogonal se the stime di the parameters associated con each factor sono independent of each other SS(total) = SS 1 +SS 2 +.....+SS k + SSE An experiment è orthogonal se each level di one factor occurs the same number di times as the number levels di the second factor, e if this applies to tutte the factors. Se an experiment è not orthogonal, allora the parameters will change each time a factor è removed from the model, e SS depends on the order in which factors sono included in the model

35 How to do it con SAS

36 DATA eks5_1; /* eksempel 5.1 i G. Nachman: Forsøgsplanlægning og statistisk analyse af eksperimentelle data */ /* Programmet udfører en to-sidet variansanalyse med paziente og behandling som faktorer. disegno et er fuldstændigt faktorielt */ /* Bemærk at behandling er en systematisk faktor, mens pazienteer er tilfældig */ /* Analysen forudsætter, at der ikke er interaktion imellem medikament og paziente */ INPUT pat $ treat $ y; /* indlæser data */ /* pat = paziente (kvalitativ variabel) treat = behandling (kvalitativ variabel y = response (kvantitativ variabel) */ CARDS; /* her kommer data. Kan også indlæses fra en fil */ 1 A 5.17 2 A 6.23 3 A 4.93 1 B 5.21 2 B 7.34 3 B 4.55 1 C 4.91 2 C 6.18 3 C 4.64 1 D 4.74 2 D 6.31 3 D 4.61 ; PROC GLM; /* procedure General Linear Models */ TITLE 'Eksempel 5.1'; /* medtages hvis der ønskes en titel */ CLASS pat treat; /* pat og treat er klasse (kvalitative) variable */ MODEL y = pat treat / CLM SOLUTION; /* modellen forudsætter at y afhænger af paziente og behandling */ /* CLM er en option som giver sikkerhedsgrænserne omkring middelværdien per en given kombination af paziente og behandling */ /* SOLUTION udprinter parameterstimarne */ OUTPUT OUT=new P = pred R= res; /* OUTPUT laver et nyt datasæt kaldet new. Det indeholder variablen pred og res, som er de predikterede værdier og residualerne */ /* Test parvise forskelle mellem behandlinger */ CONTRAST 'A versus B' Treat 1 -1 0 0; CONTRAST 'A versus C' Treat 1 0 -1 0; CONTRAST 'A versus D' Treat 1 0 0 -1; CONTRAST 'B versus C' Treat 0 1 -1 0; CONTRAST 'B versus D' Treat 0 1 0 -1; CONTRAST 'C versus D' Treat 0 0 1 -1; RUN; PROC PLOT DATA=new; /* plotter procedure */ TITLE 'Eksempel 5.1'; /* titel */ TITLE 'residual plottet mod predikterede værdier'; /* titel per plot */ PLOT res*pred = '*'; /* res plottes mod pred med * som symbol */ RUN; PROC UNIVARIATE FREQ PLOT NORMAL DATA=new; /* PROC UNIVARIATE giver information om den eller de variable, der defineres i VAR linien nedenfor. */ /* FREQ, PLOT, NORMAL osv. er options FREQ = antal observationer af en given værdi PLOT = plot af observationerne NORMAL = test per normalfordeling */ TITLE 'Eksempel 5.1'; /* titel */ VAR res; /* informationer om variablen res */ RUN; DATA eks5_1; /* eksempel 5.1 i G. Nachman: Forsøgsplanlægning og statistisk analyse af eksperimentelle data */ /* Programmet udfører en to-sidet variansanalyse med paziente og behandling som faktorer. disegno et er fuldstændigt faktorielt */ /* Analysen forudsætter, at der ikke er interaktion imellem medikament og paziente */ INPUT pat $ treat $ y; /* indlæser data */ /* pat = paziente (kvalitativ variabel) treat = behandling (kvalitativ variabel y = response (kvantitativ variabel) */ CARDS; /* her kommer data. Kan også indlæses fra en fil */ 1 A 5.17 2 A 6.23 3 A 4.93 1 B 5.21 2 B 7.34 3 B 4.55 1 C 4.91 2 C 6.18 3 C 4.64 1 D 4.74 2 D 6.31 3 D 4.61 ;

37 PROC GLM; /* procedure General Linear Models */ TITLE 'Eksempel 5.1'; /* medtages hvis der ønskes en titel */ CLASS pat treat; /* pat og treat er klasse (kvalitative) variable */ MODEL y = pat treat / CLM SOLUTION; /* modellen forudsætter at y afhænger af paziente og behandling */ /* CLM er en option som giver sikkerhedsgrænserne omkring middelværdien per en given kombination af paziente og behandling */ /* SOLUTION udprinter parameterstimarne */ OUTPUT OUT=new P = pred R= res; /* OUTPUT laver et nyt datasæt kaldet new. Det indeholder variablen pred og res, som er de predikterede værdier og residualerne */ RUN;

38 Eksempel 5.1 7 13:18 Monday, November 5, 2001 General Linear Models Procedure Class Level Information Class Levels Values PAT 3 1 2 3 TREAT 4 A B C D Number di observations in data set = 12

39 Eksempel 5.1 8 13:18 Monday, November 5, 2001 General Linear Models Procedure Dependent Variable: Y Source DF Sum di Squares Mean Square F Value Pr > F Model 5 8.09475000 1.61895000 13.80 0.0031 Error 6 0.70401667 0.11733611 Corrected Total 11 8.79876667 R-Square C.V. Root MSE Y Mean 0.919987 6.341443 0.34254359 5.40166667 Source DF tipo I SS Mean Square F Value Pr > F PAT 2 7.64831667 3.82415833 32.59 0.0006 TREAT 3 0.44643333 0.14881111 1.27 0.3666 Source DF tipo III SS Mean Square F Value Pr > F PAT 2 7.64831667 3.82415833 32.59 0.0006 TREAT 3 0.44643333 0.14881111 1.27 0.3666 Globale significatività di the model Explained variationpazienti sono significativamente different Farmaci sono not significativamente different

40 T per H0: Pr > |T| Std Error of Parameter stima Parameter=0 stima INTERCEPT 4.500833333 B 18.58 0.0001 0.24221490 PAT 1 0.325000000 B 1.34 0.2282 0.24221490 2 1.832500000 B 7.57 0.0003 0.24221490 3 0.000000000 B... TREAT A 0.223333333 B 0.80 0.4550 0.27968567 B 0.480000000 B 1.72 0.1369 0.27968567 C 0.023333333 B 0.08 0.9362 0.27968567 D 0.000000000 B... NOTE: The X'X matrix has been found to be singular e a generalized inverse was used to solve the normal equations. stime followed by the letter 'B' sono biased, e sono not unique estimators di the parameters.


Scaricare ppt "Disegno del modello di analisi dei dati sperimentali Lezione 3: Analisi della varianza (ANOVA)"

Presentazioni simili


Annunci Google