La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Corso di biomatematica lezione 7: Test di significatività Davide Grandi.

Presentazioni simili


Presentazione sul tema: "Corso di biomatematica lezione 7: Test di significatività Davide Grandi."— Transcript della presentazione:

1 Corso di biomatematica lezione 7: Test di significatività Davide Grandi

2 Sommario Test per la bontà delladattamento Stabilire delle ipotesi Test del 2 Test del 2 e correzione di Yates

3 Adattamento dei dati Davide Grandi - Dottorato in Biologia Bontà delladattamentoBontà delladattamento Lo scopo è verificare se esiste un accordo tra una distribuzione osservata ed una distribuzione attesa. Per questo scopo è stato proposto il 2 E un metodo detto di INFERENZA statistica. Il 2 serve anche per confrontare 2 o più distribuzioni statistiche: posso avere: 1.differenze piccole (accidentali…) 2.differenze grandi (non per caso) Devo dunque dedurre scientificamente: 1.differenze sono trascurabili (caso) 2.distribuzione osservata realmente diversa (attesa)

4 Adattamento dei dati Davide Grandi - Dottorato in Biologia Bontà delladattamentoBontà delladattamento Voglio trarre conclusioni generali dal singolo esperimento: E possibile ricorrere al test del 2 utilizzando le frequenze assolute, cioè: Dove i suffissi indicano la frequenza attesa o osservata ed i gradi di libertà (g.d.l.) sono n – 1 (n numero di gruppi o classi NON numero di individui) Se tra n variabili casuali ho k vincoli, i g.d.l. del 2 corrispondente diventano n – k

5 Adattamento dei dati Davide Grandi - Dottorato in Biologia SchemaSchema Il procedimento logico sarà dunque: Stabilisco unipotesi nulla H 0 ed una alternativa H 1 Scelgo il test più appropriato Specifico il livello di significatività (indicato con ) Trovo la distribuzione di campionamento nellipotesi nulla (da tabelle) Stabilisco la zona di rifiuto (di norma =0.05 ) Calcolo il valore del test statistico stimando la probabilità P ad esso associata Data P traggo le conclusioni: P> non rifiuto H 0, P< rifiuto H 0 e accetto H 1

6 Adattamento dei dati Davide Grandi - Dottorato in Biologia Esempio 1Esempio 1 Abbiamo delle distribuzioni fenotipiche (osservate ed attese) di Pisum sativum in un esperimento di mendel per due caratteri: distribuzione (teorica attesa 9:3:3:1) FenotipiFreq. Osserv.Freq. Attese Gialli lisci3159/16=312,75 Gialli rugosi1013/16=104,25 Verdi lisci1083/16=104,25 Verdi rugosi321/16=34,75 totale556556,00

7 Adattamento dei dati Davide Grandi - Dottorato in Biologia Esempio 1Esempio 1 Le distribuzione attesa e quella osservata sono ovviamente diverse, calcoliamoci ora il 2 i cui gradi di libertà saranno come accennato 3= n – 1 Ora consultiamo le tavole stimando la probabilità di trovare differenze superiori a quelle riscontrate nellipotesi nulla H 0

8 Adattamento dei dati Davide Grandi - Dottorato in Biologia Esempio 1Esempio 1 Per =0,05 Per 3 gradi di libertà (come accennato 3= n – 1) Abbiamo 2 =7,81 Il valore calcolato dunque è molto diverso da quello riportato in tabella per =0,05, ovvero la probabilità di trovare per caso le differenze osservate o ancora maggiori che possano essere attribuite al caso è alta, superiore al valore prefissato del 5%, in generale avremo 2 alto probabile H 1 2 basso probabile H 0

9 Adattamento dei dati Davide Grandi - Dottorato in Biologia Esempio 2Esempio 2 Abbiamo una popolazione di Mixodiaptomus kupelwieseri campionate in una pozza temporanea sono state osservate le seguenti frequenze di 4 alleli del locus MPI (mannoso fosfato isomerasi): Tipo di AlleleFreq. Osserv. Allele 126 Allele 238 Allele 362 Allele 4118 totale244

10 Adattamento dei dati Davide Grandi - Dottorato in Biologia Esempio 2Esempio 2 Mi chiedo dunque se sono le stesse frequenze (differenze dovute al caso) ovvero ipotesi nulla H 0 Oppure sono differenti, ipotesi alternativa H 1 ? Ora se fosse vera lipotesi nulla dovrei avere frequenza 244/4 = 61 (valore atteso), per cui calcolando il 2 otteniamo:

11 Adattamento dei dati Davide Grandi - Dottorato in Biologia Esempio 2Esempio 2 Dalla tabella del 2 per tre gradi di libertà abbiamo Per = 0.05 abbiamo 2 = 7,82 Per = 0.01 abbiamo 2 = 11,43 Per = abbiamo 2 =16,27 Il valore del 2 calcolato da noi è superiore, il che significa che la probabilità che le differenze tra le frequenze attese e quelle riscontrate siano dovute al caso è molto piccola, inferiore anche allo 0,1%. Rigetto lipotesi H 0 e accetto H 1

12 Adattamento dei dati Davide Grandi - Dottorato in Biologia Validità e correzione di YatesValidità e correzione di Yates Il valore del 2 è determinato dai gradi di libertà e quindi dal numero di gruppi, se il numero di frequenze attese e piccolo, o il campione contiene pochi elementi (tra 100 e 30), è necessario correggere per la continuità (Yates). Ovvero data la misura precisa X si dovrà considerare lo spazio unitario compreso tra X – 0.5 e X+0.5. Posso calcolare dunque il 2 in due modi: 1.Sottraggo 0.5 ad ogni scarto in valore assoluto 2.Sottraggo 0.5 allo scarto maggiore e aggiungo 0.5 a quello minore Riduco sempre con la correzione il valore del 2

13 Adattamento dei dati Davide Grandi - Dottorato in Biologia Test a 1 e a 2 codeTest a 1 e a 2 code Abbiamo la possibilità di effettuare dei test cosiddetti ad una coda (unilaterali) o a due code (bilaterali) in funzione della parte di distribuzione gaussiana che consideriamo, ovvero se solo oltre un certo valore di Z=(x – m)/ con segno o considerandone il valore assoluto. Nel test ad una coda mi chiedo solamente se una media è maggiore di unaltra (o di un valore atteso), escludendo a priori che possa esere minore Nel test a due code mi chiedo se tra le due medie o la media ed il valore atteso esistano differenze significative senza indicazioni su chi sia maggiore o minore.

14 Adattamento dei dati Davide Grandi - Dottorato in Biologia Test a 1 e a 2 codeTest a 1 e a 2 code I test unilaterali sono più potenti dei test bilaterali e a volte sono anche logicamente più appropriati (ad esempio se so che un determinato farmaco è più efficace dellaltro e devo solamente verificare se lo è in una determinata percentuale. In termini tecnici si dice che il test a due code è più conservativo.


Scaricare ppt "Corso di biomatematica lezione 7: Test di significatività Davide Grandi."

Presentazioni simili


Annunci Google