Corso di biomatematica lezione 7: Test di significatività

Slides:



Advertisements
Presentazioni simili
Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Advertisements

8) GLI INTERVALLI DI CONFIDENZA
I TEST DI SIGNIFICATIVITA' IL TEST DI STUDENT
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI
Passo 1: trasformare tutte le percentuali in frequenze (senza sapere la numerosità sulla quale sono state calcolate, non si può fare il confronto tra %)
Il chi quadro indica la misura in cui le
Analisi Bivariata e Test Statistici
Corso di Calcolo delle Probabilità e Statistica II Parte – STATISTICA
Inferenza statistica per un singolo campione
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
DIFFERENZA TRA LE MEDIE
Analisi della varianza (a una via)
Le analisi per singolo item
1 Introduzione alla statistica per la ricerca Lezione III Dr. Stefano Guidi Siena, 18 Ottobre 2012.
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 5: propagazione degli errori
Corso di biomatematica lezione 9: test di Student
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 4: La funzione di Gauss
Corso di biomatematica Lezione 2: Probabilità e distribuzioni di probabilità Davide Grandi.
Corso di biomatematica lezione 6: la funzione c2
Corso di biomatematica lezione 7-2: Test di significatività
Corso di biomatematica Lezione 3: Distribuzioni di probabilità continue Davide Grandi.
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a LA STATISTICA INFERENZIALE
di cosa si occupa la statistica inferenziale?
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Corso di biomatematica lezione 3b: applicazioni di probabilità Davide Grandi.
Il test di ipotesi Cuore della statistica inferenziale!
Verifica delle ipotesi su due campioni di osservazioni
Le distribuzioni campionarie
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
STATISTICA CHEMIOMETRICA
Test parametrici I test studiati nelle lezioni precedenti (test- t, test-z) consentono la verifica di ipotesi relative al valore di specifici parametri.
Corso di biomatematica lezione 7-3: Test di significatività
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Il test del Chi-quadrato
Nelle popolazioni naturali la variabilità genetica (ovvero ereditaria) può essere di tipo qualitativo o quantitativo La variabilità qualitativa si riscontra.
Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l. SIGNIFICATIVITÀ.
La verifica d’ipotesi Docente Dott. Nappo Daniela
ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Accenni di analisi monovariata e bivariata
La statistica F Permette di confrontare due varianze, per stabilire se sono o no uguali. Simile al valore t di Student o al chi quadrato, l’F di Fisher.
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Test basati su due campioni Test Chi - quadro
“Teoria e metodi della ricerca sociale e organizzativa”
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Accenni di analisi monovariata e bivariata
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
ANALISI E INTERPRETAZIONE DATI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Correlazione e regressione lineare
TEST STATISTICI PER SCALE NOMINALI, TASSI E PROPORZIONI Non sempre la variabile aleatoria (risultato sperimentale) è un numero ma è spesso un esito dicotomico.
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Accenni di analisi monovariata e bivariata. ANALISI MONOVARIATA Analisi delle informazioni ricavabili da una variabile alla volta, prescindendo dalle.
L’ecologia è oggi sempre più una disciplina che enfatizza lo studio olistico del sistema. Anche se il concetto che l’intero possa essere più della somma.
INTRODUZIONE ALL’ANALISI DELLA VARIANZA
Statistica di Base per le Scienze Pediatriche luigi greco D.C.H, M.D., M.Sc.M.C.H., Ph.D. Dipartimento di Pediatria UniFEDERICOII.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

Corso di biomatematica lezione 7: Test di significatività Davide Grandi

Sommario Test per la bontà dell’adattamento Stabilire delle ipotesi Test del c2 Test del c2 e correzione di Yates

Adattamento dei dati Bontà dell’adattamento Lo scopo è verificare se esiste un accordo tra una distribuzione osservata ed una distribuzione attesa. Per questo scopo è stato proposto il c2 E’ un metodo detto di INFERENZA statistica. Il c2 serve anche per confrontare 2 o più distribuzioni statistiche: posso avere: differenze piccole (accidentali…) differenze grandi (non per caso) Devo dunque dedurre scientificamente: differenze sono trascurabili (caso) distribuzione osservata realmente diversa (attesa) Davide Grandi - Dottorato in Biologia

Adattamento dei dati Bontà dell’adattamento Voglio trarre conclusioni generali dal singolo esperimento: E’ possibile ricorrere al test del cn2 utilizzando le frequenze assolute, cioè: Dove i suffissi indicano la frequenza attesa o osservata ed i gradi di libertà (g.d.l.) sono n – 1 (n numero di gruppi o classi NON numero di individui) Se tra n variabili casuali ho k vincoli, i g.d.l. del c2 corrispondente diventano n – k Davide Grandi - Dottorato in Biologia

Adattamento dei dati Schema Il procedimento logico sarà dunque: Stabilisco un’ipotesi nulla H0 ed una alternativa H1 Scelgo il test più appropriato Specifico il livello di significatività (indicato con a) Trovo la distribuzione di campionamento nell’ipotesi nulla (da tabelle) Stabilisco la zona di rifiuto (di norma a=0.05 ) Calcolo il valore del test statistico stimando la probabilità P ad esso associata Data P traggo le conclusioni: P> a non rifiuto H0 , P< a rifiuto H0 e accetto H1 Davide Grandi - Dottorato in Biologia

Adattamento dei dati Esempio 1 Abbiamo delle distribuzioni fenotipiche (osservate ed attese) di Pisum sativum in un esperimento di mendel per due caratteri: distribuzione (teorica attesa 9:3:3:1) Fenotipi Freq. Osserv. Freq. Attese Gialli lisci 315 9/16=312,75 Gialli rugosi 101 3/16=104,25 Verdi lisci 108 Verdi rugosi 32 1/16=34,75 totale 556 556,00 Davide Grandi - Dottorato in Biologia

Adattamento dei dati Esempio 1 Le distribuzione attesa e quella osservata sono ovviamente diverse, calcoliamoci ora il c2 i cui gradi di libertà saranno come accennato 3= n – 1 Ora consultiamo le tavole stimando la probabilità di trovare differenze superiori a quelle riscontrate nell’ipotesi nulla H0 Davide Grandi - Dottorato in Biologia

Adattamento dei dati Esempio 1 Per a=0,05 Per 3 gradi di libertà (come accennato 3= n – 1) Abbiamo c2 =7,81 Il valore calcolato dunque è molto diverso da quello riportato in tabella per a=0,05, ovvero la probabilità di trovare per caso le differenze osservate o ancora maggiori che possano essere attribuite al caso è alta, superiore al valore prefissato del 5%, in generale avremo c2 alto probabile H1 c2 basso probabile H0 Davide Grandi - Dottorato in Biologia

Adattamento dei dati Esempio 2 Abbiamo una popolazione di Mixodiaptomus kupelwieseri campionate in una pozza temporanea sono state osservate le seguenti frequenze di 4 alleli del locus MPI (mannoso fosfato isomerasi): Tipo di Allele Freq. Osserv. Allele 1 26 Allele 2 38 Allele 3 62 Allele 4 118 totale 244 Davide Grandi - Dottorato in Biologia

Adattamento dei dati Esempio 2 Mi chiedo dunque se sono le stesse frequenze (differenze dovute al caso) ovvero ipotesi nulla H0 Oppure sono differenti, ipotesi alternativa H1? Ora se fosse vera l’ipotesi nulla dovrei avere frequenza 244/4 = 61 (valore atteso), per cui calcolando il c2 otteniamo: Davide Grandi - Dottorato in Biologia

Adattamento dei dati Esempio 2 Dalla tabella del c2 per tre gradi di libertà abbiamo Per a = 0.05 abbiamo c2 = 7,82 Per a = 0.01 abbiamo c2 = 11,43 Per a = 0.001 abbiamo c2 =16,27 Il valore del c2 calcolato da noi è superiore, il che significa che la probabilità che le differenze tra le frequenze attese e quelle riscontrate siano dovute al caso è molto piccola, inferiore anche allo 0,1%. Rigetto l’ipotesi H0 e accetto H1 Davide Grandi - Dottorato in Biologia

Adattamento dei dati Validità e correzione di Yates Il valore del c2 è determinato dai gradi di libertà e quindi dal numero di gruppi, se il numero di frequenze attese e piccolo, o il campione contiene pochi elementi (tra 100 e 30), è necessario correggere per la continuità (Yates). Ovvero data la misura precisa X si dovrà considerare lo spazio unitario compreso tra X – 0.5 e X+0.5. Posso calcolare dunque il c2 in due modi: Sottraggo 0.5 ad ogni scarto in valore assoluto Sottraggo 0.5 allo scarto maggiore e aggiungo 0.5 a quello minore Riduco sempre con la correzione il valore del c2 Davide Grandi - Dottorato in Biologia

Adattamento dei dati Test a 1 e a 2 code Abbiamo la possibilità di effettuare dei test cosiddetti ad una coda (unilaterali) o a due code (bilaterali) in funzione della parte di distribuzione gaussiana che consideriamo, ovvero se solo oltre un certo valore di Z=(x – m)/s con segno o considerandone il valore assoluto. Nel test ad una coda mi chiedo solamente se una media è maggiore di un’altra (o di un valore atteso), escludendo a priori che possa esere minore Nel test a due code mi chiedo se tra le due medie o la media ed il valore atteso esistano differenze significative senza indicazioni su chi sia maggiore o minore. Davide Grandi - Dottorato in Biologia

Adattamento dei dati Test a 1 e a 2 code I test unilaterali sono più potenti dei test bilaterali e a volte sono anche logicamente più appropriati (ad esempio se so che un determinato farmaco è più efficace dell’altro e devo solamente verificare se lo è in una determinata percentuale. In termini tecnici si dice che il test a due code è più conservativo. Davide Grandi - Dottorato in Biologia