Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoFelisa Guarino Modificato 10 anni fa
1
Corso di biomatematica lezione 7: Test di significatività
Davide Grandi
2
Sommario Test per la bontà dell’adattamento Stabilire delle ipotesi Test del c2 Test del c2 e correzione di Yates
3
Adattamento dei dati Bontà dell’adattamento
Lo scopo è verificare se esiste un accordo tra una distribuzione osservata ed una distribuzione attesa. Per questo scopo è stato proposto il c2 E’ un metodo detto di INFERENZA statistica. Il c2 serve anche per confrontare 2 o più distribuzioni statistiche: posso avere: differenze piccole (accidentali…) differenze grandi (non per caso) Devo dunque dedurre scientificamente: differenze sono trascurabili (caso) distribuzione osservata realmente diversa (attesa) Davide Grandi - Dottorato in Biologia
4
Adattamento dei dati Bontà dell’adattamento
Voglio trarre conclusioni generali dal singolo esperimento: E’ possibile ricorrere al test del cn2 utilizzando le frequenze assolute, cioè: Dove i suffissi indicano la frequenza attesa o osservata ed i gradi di libertà (g.d.l.) sono n – 1 (n numero di gruppi o classi NON numero di individui) Se tra n variabili casuali ho k vincoli, i g.d.l. del c2 corrispondente diventano n – k Davide Grandi - Dottorato in Biologia
5
Adattamento dei dati Schema Il procedimento logico sarà dunque:
Stabilisco un’ipotesi nulla H0 ed una alternativa H1 Scelgo il test più appropriato Specifico il livello di significatività (indicato con a) Trovo la distribuzione di campionamento nell’ipotesi nulla (da tabelle) Stabilisco la zona di rifiuto (di norma a=0.05 ) Calcolo il valore del test statistico stimando la probabilità P ad esso associata Data P traggo le conclusioni: P> a non rifiuto H0 , P< a rifiuto H0 e accetto H1 Davide Grandi - Dottorato in Biologia
6
Adattamento dei dati Esempio 1
Abbiamo delle distribuzioni fenotipiche (osservate ed attese) di Pisum sativum in un esperimento di mendel per due caratteri: distribuzione (teorica attesa 9:3:3:1) Fenotipi Freq. Osserv. Freq. Attese Gialli lisci 315 9/16=312,75 Gialli rugosi 101 3/16=104,25 Verdi lisci 108 Verdi rugosi 32 1/16=34,75 totale 556 556,00 Davide Grandi - Dottorato in Biologia
7
Adattamento dei dati Esempio 1
Le distribuzione attesa e quella osservata sono ovviamente diverse, calcoliamoci ora il c2 i cui gradi di libertà saranno come accennato 3= n – 1 Ora consultiamo le tavole stimando la probabilità di trovare differenze superiori a quelle riscontrate nell’ipotesi nulla H0 Davide Grandi - Dottorato in Biologia
8
Adattamento dei dati Esempio 1 Per a=0,05
Per 3 gradi di libertà (come accennato 3= n – 1) Abbiamo c2 =7,81 Il valore calcolato dunque è molto diverso da quello riportato in tabella per a=0,05, ovvero la probabilità di trovare per caso le differenze osservate o ancora maggiori che possano essere attribuite al caso è alta, superiore al valore prefissato del 5%, in generale avremo c2 alto probabile H1 c2 basso probabile H0 Davide Grandi - Dottorato in Biologia
9
Adattamento dei dati Esempio 2
Abbiamo una popolazione di Mixodiaptomus kupelwieseri campionate in una pozza temporanea sono state osservate le seguenti frequenze di 4 alleli del locus MPI (mannoso fosfato isomerasi): Tipo di Allele Freq. Osserv. Allele 1 26 Allele 2 38 Allele 3 62 Allele 4 118 totale 244 Davide Grandi - Dottorato in Biologia
10
Adattamento dei dati Esempio 2
Mi chiedo dunque se sono le stesse frequenze (differenze dovute al caso) ovvero ipotesi nulla H0 Oppure sono differenti, ipotesi alternativa H1? Ora se fosse vera l’ipotesi nulla dovrei avere frequenza 244/4 = 61 (valore atteso), per cui calcolando il c2 otteniamo: Davide Grandi - Dottorato in Biologia
11
Adattamento dei dati Esempio 2
Dalla tabella del c2 per tre gradi di libertà abbiamo Per a = 0.05 abbiamo c2 = 7,82 Per a = 0.01 abbiamo c2 = 11,43 Per a = abbiamo c2 =16,27 Il valore del c2 calcolato da noi è superiore, il che significa che la probabilità che le differenze tra le frequenze attese e quelle riscontrate siano dovute al caso è molto piccola, inferiore anche allo 0,1%. Rigetto l’ipotesi H0 e accetto H1 Davide Grandi - Dottorato in Biologia
12
Adattamento dei dati Validità e correzione di Yates
Il valore del c2 è determinato dai gradi di libertà e quindi dal numero di gruppi, se il numero di frequenze attese e piccolo, o il campione contiene pochi elementi (tra 100 e 30), è necessario correggere per la continuità (Yates). Ovvero data la misura precisa X si dovrà considerare lo spazio unitario compreso tra X – 0.5 e X+0.5. Posso calcolare dunque il c2 in due modi: Sottraggo 0.5 ad ogni scarto in valore assoluto Sottraggo 0.5 allo scarto maggiore e aggiungo 0.5 a quello minore Riduco sempre con la correzione il valore del c2 Davide Grandi - Dottorato in Biologia
13
Adattamento dei dati Test a 1 e a 2 code
Abbiamo la possibilità di effettuare dei test cosiddetti ad una coda (unilaterali) o a due code (bilaterali) in funzione della parte di distribuzione gaussiana che consideriamo, ovvero se solo oltre un certo valore di Z=(x – m)/s con segno o considerandone il valore assoluto. Nel test ad una coda mi chiedo solamente se una media è maggiore di un’altra (o di un valore atteso), escludendo a priori che possa esere minore Nel test a due code mi chiedo se tra le due medie o la media ed il valore atteso esistano differenze significative senza indicazioni su chi sia maggiore o minore. Davide Grandi - Dottorato in Biologia
14
Adattamento dei dati Test a 1 e a 2 code
I test unilaterali sono più potenti dei test bilaterali e a volte sono anche logicamente più appropriati (ad esempio se so che un determinato farmaco è più efficace dell’altro e devo solamente verificare se lo è in una determinata percentuale. In termini tecnici si dice che il test a due code è più conservativo. Davide Grandi - Dottorato in Biologia
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.