La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA

Presentazioni simili


Presentazione sul tema: "STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA"— Transcript della presentazione:

1 STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Università degli Studi di Pisa Facoltà di Scienze matematiche fisiche e naturali Anno Accademico Biostatistica (SECS-S/02 ) STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Incontro 14 24 Novembre 2011

2 Confronti multipli non prestabiliti
La definizione a priori dei contrasti ortogonali consente grandi vantaggi di semplicità e correttezza nei test statistici relativi , ma nella pratica sperimentale non è sempre possibile pianificare a priori i confronti ,soprattutto se questi sono equivalenti o suggeriti dai risultati dell’esperimento. Esempio:In agronomia un esperimento di confronto tra varietà non permette di pianificare in anticipo dei contrasti tra le medie campionarie:è più conveniente basarsi su quanto suggeriscono i dati sperimentali e verificare se la varietà che risulta più produttiva è significativamente migliore di quella che la segue nella scala di produttività. In altri casi può essere opportuno effettuare tutti i confronti possibili tra i livelli del fattore sperimentale .

3 Test di Tukey (Metodo T) Confronti a coppie
I contrasti vengono scelti sulla base dei risultati dell’esperimento(non sono quindi prestabiliti). Si escludono i contrasti complessi. Si utilizzano i valori critici della distribuzione q (‘Intervallo di variazione studentizzato’ o ‘studentized range’): in realtà la distribuzione q è una famiglia di distribuzioni identificate dal numero dei trattamenti(p) e dai gradi di libertà(nT-p) della devianza dell’errore.

4 Test di Tukey (Metodo T) Confronti a coppie Intervallo di Confidenza
Sia p il numero di trattamenti ,l’intervallo di confidenza tra 2 medie sulla base della distribuzione q è definito come :

5 Test di Tukey (Metodo T)-Confronti a coppie Test d’ipotesi
Si definisce una DMS(Differenza Minima Significativa) protetta (se il test ANOVA è risultato significativo)T che dipende dal livello di significatività prescelto α e si dichiarano significative le differenze tra medie che superano tale soglia in valore assoluto:

6 Esempio:Test di Tukey Un’esperimento bilanciato di confronto tra 5 diete ha fornito i seguenti risultati espressi come incrementi del peso dei conigli(n=5 ripetizioni per dieta vengono omesse per brevità): Medie:6.49 ,6.07 , 6.02 , 6.17 , 5.62 QM(a)= con GL(QM(a))=4 QM(e)= con GL(QM(e))=20. L’ipotesi complessiva H0:μ1=μ2=μ3=μ4=μ5 viene respinta sulla base dei test F4,20=0.5806/0.1468=3.96 che risulta significativo al livello di α=0.05. Naturalmente è lecito chiedersi quale differenza tra i valori medi delle singole varietà sia responsabile del rifiuto dell’ipotesi complessiva.

7 Esempio:Test di Tukey Le differenze tra le medie campionarie possono essere riportate nella seguente tabella: Dieta 1 Dieta 2 Dieta 3 Dieta 4 Dieta 5 Media: 6.49 6.07 6.02 6.17 5.62 0.42 ……. 0.47 0.05 …….. 0.32 -0.10 -0.15 ………. 0.87 0.45 0.40 0.55 Numero dei contrasti a coppia possibili

8 Esempio:Test di Tukey H0:λ(k)=0 , H0:μi- μi’=0 con i,i’=1,2,….5.
È opportuno formulare delle ipotesi nulle per il confronto tra le medie dei trattamenti ,indicate generalmente come: H0:λ(k)=0 , corrispondenti , alla formulazione: H0:μi- μi’=0 con i,i’=1,2,….5. Per α=0.05 la variabile q assume il valore: q0.05;5,20 =4.24 da cui: Dalla tabella si può verificare che solo il confronto tra μ1 e μ5 risulta significativo.

9 Verifica delle assunzioni dell’ANOVA
Normalità degli Errori Uguaglianza della varianza degli errori (entro trattamento) o omogeneità delle varianze. Indipendenza statistica degli errori Nella pratica sperimentale non sempre tutte le assunzioni sono rispettate!

10 Non Normalità degli Errori
La non normalità degli errori rende approssimate le stime delle componenti della varianza : se la curtosi è diversa da zero le varianze degli effetti che nel modello ad effetti random seguono una distribuzione χ 2 sono una cattiva approssimazione. Se l’esperimento è bilanciato le conseguenze della non normalità degli errori sono meno gravi.

11 Non omogeneità delle varianze
Le varianze campionarie stimano tutte la stessa varianza,comune a tutte le popolazioni La non uguaglianza delle varianze entro gruppi fa in modo che il vero valore di α superi il suo valore nominale(anche per 2 soli trattamenti):tale effetto sul livello di significatività si accentua quando l’esperimento è sbilanciato .

12 H0:σ1=σ2=σ3=….=σp Test di Cochran
Se l’esperimento è bilanciato ,l’ipotesi di omogeneità tra le varianze entro-trattamento H0:σ1=σ2=σ3=….=σp viene saggiata tramite la statistica-test : Si utilizzano apposite tavole per confrontare il valore della statistica-test con i valori critici,fissato il livello di significatività. Se il valore è significativo(maggiore del valore della tabella) rifiuto l’ipotesi di omogeneità tra le varianze.

13 Analisi della varianza non parametrica
Se le assunzioni dell’analisi della varianza vengono seriamente violate ,cioè quando i campioni sono estratti da popolazioni non normalmente distribuiti e con varianze disuguali si può ricorrere a procedure alternative non parametriche : Test sulla mediana per p campioni Test H di Kraskal-Wallis

14 Test sulla mediana per p campioni
È un estensione del test sulla mediana e richiede la determinazione della mediana di tutte le osservazioni dei p campioni considerati congiuntamente . Si costruisce una tabella in cui per ogni campione sono riportati il numero di osservazioni al di sopra della mediana e il numero di quelle non al di sopra. L’ipotesi nulla che le popolazioni hanno la stessa mediana ,può essere verificata con test χ2 ,applicato alla tabella 2xp. Il test può essere applicato quando il valore atteso per ogni gruppo è di almeno 5 .

15 Test H di Kruskal-Wallis
Il test H richiede che le osservazioni siano trasformate in ranghi , come indicato per il test U su due campioni ,e può essere applicato nel caso di un esperimento completamente randomizzato . L’ipotesi nulla non comprende relazioni riguardanti i parametri delle popolazioni e non vengono utilizzate statistiche campionarie per la verifica delle ipotesi stesse. L’ipotesi nulla infatti comprende solo l’appartenenza dei p campioni alla stessa popolazione ,mentre l’ipotesi alternativa dice che almeno uno dei campioni non appartiene a tale popolazione .

16 Test H di Kruskal-Wallis
Una volta trasformati ,i dati in ranghi ,indipendentemente dall’appartenenza ai singoli trattamenti , si calcola per ogni trattamento la somma dei ranghi relativi : Il rapporto SS(a)/QM(y) corrisponde ad H: ciò può essere utile in esperimenti più complessi (ANOVA a più criteri di classificazione),per i quali sia opportuno l’approccio non paramentrico. La statistica H segue la distribuzione di un χ2 con p-1 gradi di libertà ,a patto che il numero di ripetizioni per gruppo sia almeno 5 . Se l’adattamento alla distribuzione del χ2 non è valido,è possibile ricorrere ad apposite tavole di valori critici di H .

17 Esempio (ANOVA non parametrica)
L’efficacia di 3 acaricidi viene saggiata contando il numero di acari presenti su una foglia di 5 piante diverse scelte a caso e trattate con ciascun acaricida . Acaricida A Acaricida B Acaricida C 25(4) 110(15) 39(8) 21(2) 66(12) 43(9) 33(6) 91(14) 28(5) 36(7) 52(10) 11(1) 54(11) 72(13) 24(3) R1=30 R2=64 R3=26 n1=5 n2=5 n3=5 nT=15

18 Esempio (ANOVA non parametrica)
L’ipotesi nulla può essere formulata come segue : H0:il numero di acari per foglia è uguale nelle piante trattate con i 3 acaricidi. L’ipotesi è verificata con la statistica-test: Il valore critico di χ2 con 2 gradi di libertà per α=0.05 è 5.99 : l’ipotesi nulla può quindi essere rifiutata.

19 Esercizio(Anova) E' stato condotto un esperimento per confrontare il raccolto di 4 varietà di riso. Ognuno dei 16 appezzamenti della fattoria sottoposta al test è stato trattato in modo simile per quanto concerne l'acqua e il fertilizzante. Quattro appezzamenti sono stati assegnati casualmente ad ognuna delle 4 varietà di riso. Il raccolto di ogni appezzamento è stato annotato in libbre per acro nella seguente tabella: Varietà Raccolti 1 934 1041 1028 935 2 880 963 924 946 3 987 951 976 840 4 992 1143 1140 1191 I dati della tabella indicano una differenza nel raccolto medio delle 4 varietà? Usare un'analisi della varianza con α = 0.05.

20

21

22

23

24

25 Esercizio 2 L'assorbimento da parte del suolo dei metalli che fuoriescono nell'aria durante alcuni processi industriali produce gravi danni ambientali. Per accertarsi se le percentuali di assorbimento variano tra i tipi di terreno,sono stati casualmente scelti 6 campioni di terre coltivate, aventi 5 tipi di suolo differenti (1, 2, 3, 4, 5) in un'area nota per avere un'esposizione relativamente uniforme ai metalli osservati. I 30 campioni di terreno sono stati analizzati per contenuto di cadmio (Cd). I risultati sono presentati nella seguente tabella. Eseguire un'analisi della varianza per determinare se vi siano differenze nel contenuto di cadmio tra i terreni.

26 Esercizio 2

27

28

29

30

31 Esercizio 3

32

33

34

35 Grazie per l’attenzione


Scaricare ppt "STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA"

Presentazioni simili


Annunci Google