La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Biostatistica (SECS-S/02 ) STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Incontro 14 24 Novembre 2011 Università degli Studi di Pisa Facoltà di.

Presentazioni simili


Presentazione sul tema: "Biostatistica (SECS-S/02 ) STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Incontro 14 24 Novembre 2011 Università degli Studi di Pisa Facoltà di."— Transcript della presentazione:

1 Biostatistica (SECS-S/02 ) STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Incontro Novembre 2011 Università degli Studi di Pisa Facoltà di Scienze matematiche fisiche e naturali Anno Accademico

2 Confronti multipli non prestabiliti La definizione a priori dei contrasti ortogonali consente grandi vantaggi di semplicità e correttezza nei test statistici relativi, ma nella pratica sperimentale non è sempre possibile pianificare a priori i confronti,soprattutto se questi sono equivalenti o suggeriti dai risultati dellesperimento. Esempio:In agronomia un esperimento di confronto tra varietà non permette di pianificare in anticipo dei contrasti tra le medie campionarie:è più conveniente basarsi su quanto suggeriscono i dati sperimentali e verificare se la varietà che risulta più produttiva è significativamente migliore di quella che la segue nella scala di produttività. In altri casi può essere opportuno effettuare tutti i confronti possibili tra i livelli del fattore sperimentale.

3 Test di Tukey (Metodo T) Confronti a coppie I contrasti vengono scelti sulla base dei risultati dellesperimento(non sono quindi prestabiliti). Si escludono i contrasti complessi. Si utilizzano i valori critici della distribuzione q (Intervallo di variazione studentizzato o studentized range): in realtà la distribuzione q è una famiglia di distribuzioni identificate dal numero dei trattamenti(p) e dai gradi di libertà(n T -p) della devianza dellerrore.

4 Sia p il numero di trattamenti,lintervallo di confidenza tra 2 medie sulla base della distribuzione q è definito come : Test di Tukey (Metodo T) Confronti a coppie Intervallo di Confidenza

5 Test di Tukey (Metodo T)-Confronti a coppie Test dipotesi Si definisce una DMS(Differenza Minima Significativa) protetta (se il test ANOVA è risultato significativo)T che dipende dal livello di significatività prescelto α e si dichiarano significative le differenze tra medie che superano tale soglia in valore assoluto:

6 Unesperimento bilanciato di confronto tra 5 diete ha fornito i seguenti risultati espressi come incrementi del peso dei conigli(n=5 ripetizioni per dieta vengono omesse per brevità): Medie:6.49,6.07, 6.02, 6.17, 5.62 QM(a)= con GL(QM(a))=4 QM(e)= con GL(QM(e))=20. Lipotesi complessiva H 0 :μ1=μ2=μ3=μ4=μ5 viene respinta sulla base dei test F 4,20 =0.5806/0.1468=3.96 che risulta significativo al livello di α=0.05. Naturalmente è lecito chiedersi quale differenza tra i valori medi delle singole varietà sia responsabile del rifiuto dellipotesi complessiva. Esempio:Test di Tukey

7 Le differenze tra le medie campionarie possono essere riportate nella seguente tabella: Esempio:Test di Tukey Dieta 1Dieta 2Dieta 3Dieta 4Dieta 5 Media: Dieta ……. Dieta …….. Dieta ………. Dieta ………. Numero dei contrasti a coppia possibili

8 È opportuno formulare delle ipotesi nulle per il confronto tra le medie dei trattamenti,indicate generalmente come: H 0 :λ(k)=0, corrispondenti, alla formulazione: H 0 :μ i - μ i =0 con i,i=1,2,….5. Per α=0.05 la variabile q assume il valore: q 0.05;5,20 =4.24 da cui: Esempio:Test di Tukey Dalla tabella si può verificare che solo il confronto tra μ 1 e μ 5 risulta significativo.

9 Verifica delle assunzioni dellANOVA 1)Normalità degli Errori 2)Uguaglianza della varianza degli errori (entro trattamento) o omogeneità delle varianze. 3)Indipendenza statistica degli errori Nella pratica sperimentale non sempre tutte le assunzioni sono rispettate!

10 Non Normalità degli Errori La non normalità degli errori rende approssimate le stime delle componenti della varianza : se la curtosi è diversa da zero le varianze degli effetti che nel modello ad effetti random seguono una distribuzione χ 2 sono una cattiva approssimazione. Se lesperimento è bilanciato le conseguenze della non normalità degli errori sono meno gravi.

11 Non omogeneità delle varianze Le varianze campionarie stimano tutte la stessa varianza,comune a tutte le popolazioni La non uguaglianza delle varianze entro gruppi fa in modo che il vero valore di α superi il suo valore nominale(anche per 2 soli trattamenti):tale effetto sul livello di significatività si accentua quando lesperimento è sbilanciato.

12 Test di Cochran Se lesperimento è bilanciato,lipotesi di omogeneità tra le varianze entro-trattamento H 0 :σ 1 =σ 2 =σ 3 =….=σ p viene saggiata tramite la statistica-test : Si utilizzano apposite tavole per confrontare il valore della statistica-test con i valori critici,fissato il livello di significatività. Se il valore è significativo(maggiore del valore della tabella) rifiuto lipotesi di omogeneità tra le varianze.

13 Analisi della varianza non parametrica Se le assunzioni dellanalisi della varianza vengono seriamente violate,cioè quando i campioni sono estratti da popolazioni non normalmente distribuiti e con varianze disuguali si può ricorrere a procedure alternative non parametriche : –Test sulla mediana per p campioni –Test H di Kraskal-Wallis

14 Test sulla mediana per p campioni È un estensione del test sulla mediana e richiede la determinazione della mediana di tutte le osservazioni dei p campioni considerati congiuntamente. Si costruisce una tabella in cui per ogni campione sono riportati il numero di osservazioni al di sopra della mediana e il numero di quelle non al di sopra. Lipotesi nulla che le popolazioni hanno la stessa mediana,può essere verificata con test χ 2,applicato alla tabella 2xp. Il test può essere applicato quando il valore atteso per ogni gruppo è di almeno 5.

15 Test H di Kruskal-Wallis Il test H richiede che le osservazioni siano trasformate in ranghi, come indicato per il test U su due campioni,e può essere applicato nel caso di un esperimento completamente randomizzato. Lipotesi nulla non comprende relazioni riguardanti i parametri delle popolazioni e non vengono utilizzate statistiche campionarie per la verifica delle ipotesi stesse. Lipotesi nulla infatti comprende solo lappartenenza dei p campioni alla stessa popolazione,mentre lipotesi alternativa dice che almeno uno dei campioni non appartiene a tale popolazione.

16 Una volta trasformati,i dati in ranghi,indipendentemente dallappartenenza ai singoli trattamenti, si calcola per ogni trattamento la somma dei ranghi relativi : Test H di Kruskal-Wallis La statistica H segue la distribuzione di un χ 2 con p-1 gradi di libertà,a patto che il numero di ripetizioni per gruppo sia almeno 5. Se ladattamento alla distribuzione del χ 2 non è valido,è possibile ricorrere ad apposite tavole di valori critici di H. Il rapporto SS(a)/QM(y) corrisponde ad H: ciò può essere utile in esperimenti più complessi (ANOVA a più criteri di classificazione),per i quali sia opportuno lapproccio non paramentrico.

17 Esempio (ANOVA non parametrica) Lefficacia di 3 acaricidi viene saggiata contando il numero di acari presenti su una foglia di 5 piante diverse scelte a caso e trattate con ciascun acaricida. Acaricida AAcaricida BAcaricida C 25(4)110(15)39(8) 21(2)66(12)43(9) 33(6)91(14)28(5) 36(7)52(10)11(1) 54(11)72(13)24(3) R 1 =30R 2 =64R 3 =26 n 1 =5n 2 =5n 3 =5n T =15

18 Lipotesi nulla può essere formulata come segue : H 0 :il numero di acari per foglia è uguale nelle piante trattate con i 3 acaricidi. Lipotesi è verificata con la statistica-test: Esempio (ANOVA non parametrica) Il valore critico di χ 2 con 2 gradi di libertà per α=0.05 è 5.99 : lipotesi nulla può quindi essere rifiutata.

19 Esercizio(Anova) E' stato condotto un esperimento per confrontare il raccolto di 4 varietà di riso. Ognuno dei 16 appezzamenti della fattoria sottoposta al test è stato trattato in modo simile per quanto concerne l'acqua e il fertilizzante. Quattro appezzamenti sono stati assegnati casualmente ad ognuna delle 4 varietà di riso. Il raccolto di ogni appezzamento è stato annotato in libbre per acro nella seguente tabella: VarietàRaccolti I dati della tabella indicano una differenza nel raccolto medio delle 4 varietà? Usare un'analisi della varianza con α = 0.05.

20

21

22

23

24

25 Esercizio 2 L'assorbimento da parte del suolo dei metalli che fuoriescono nell'aria durante alcuni processi industriali produce gravi danni ambientali. Per accertarsi se le percentuali di assorbimento variano tra i tipi di terreno,sono stati casualmente scelti 6 campioni di terre coltivate, aventi 5 tipi di suolo differenti (1, 2, 3, 4, 5) in un'area nota per avere un'esposizione relativamente uniforme ai metalli osservati. I 30 campioni di terreno sono stati analizzati per contenuto di cadmio (Cd). I risultati sono presentati nella seguente tabella. Eseguire un'analisi della varianza per determinare se vi siano differenze nel contenuto di cadmio tra i terreni.

26 Esercizio 2

27

28

29

30

31 Esercizio 3

32

33

34

35 Grazie per lattenzione


Scaricare ppt "Biostatistica (SECS-S/02 ) STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Incontro 14 24 Novembre 2011 Università degli Studi di Pisa Facoltà di."

Presentazioni simili


Annunci Google