Boscaro Gianni & Brugnaro Luca

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Le distribuzioni di probabilità continue
I TEST DI SIGNIFICATIVITA' IL TEST DI STUDENT
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI
Intervalli di confidenza
Il chi quadro indica la misura in cui le
1 la competenza alfabetica della popolazione italiana CEDE distribuzione percentuale per livelli.
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Lez. 3 - Gli Indici di VARIABILITA’
Analisi dei dati per i disegni ad un fattore
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Test Statistici Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
Corso di Calcolo delle Probabilità e Statistica II Parte – STATISTICA
Inferenza statistica per un singolo campione
Valutazione delle Prestazioni di un Classificatore
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
Esercitazione su test d’ipotesi
DIFFERENZA TRA LE MEDIE
Analisi della varianza (a una via)
Matematica e statistica Versione didascalica: parte 7 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste.
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 9: test di Student
Corso di biomatematica lezione 10: test di Student e test F
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a LA STATISTICA INFERENZIALE
Esercizi x1=m-ts x2=m+ts
di cosa si occupa la statistica inferenziale?
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Lezione 8 Numerosità del campione
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 7 i Test statistici
Lezione 8 La valutazione dello scarto per “fuori tolleranza”
Confronto fra 2 popolazioni
Da studi svolti negli anni ‘50 è emerso che il numero ideale di figli per famiglia è di 3. Nel 1980, ipotizzando una modifica nei costumi e nei modelli.
Il test di ipotesi Cuore della statistica inferenziale!
Verifica delle ipotesi su due campioni di osservazioni
METODI E CONTROLLI STATISTICI DI PROCESSO
Principali analisi statistiche
Esercitazioni sul calcolo dei valori critici
Le distribuzioni campionarie
Test parametrici I test studiati nelle lezioni precedenti (test- t, test-z) consentono la verifica di ipotesi relative al valore di specifici parametri.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Il test del Chi-quadrato
Analisi Bivariata: Test Statistici
Raffronto tra il peso di femmine e maschi Raffronto tra la lunghezza di femmine e maschi.
La verifica d’ipotesi Docente Dott. Nappo Daniela
ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Corso di Analisi Statistica per le Imprese
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Test basati su due campioni Test Chi - quadro
“Teoria e metodi della ricerca sociale e organizzativa”
La distribuzione campionaria della media
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
Dalmine, 26 Maggio 2004 Esercitazioni di Statistica con Matlab Dott. Orietta Nicolis fttp:\ingegneria.unibg.it.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
Transcript della presentazione:

Boscaro Gianni & Brugnaro Luca Interpretazione dei fenomeni in ambito sanitario: dal campione alla popolazione Esercitazioni di Inferenza Statistica Boscaro Gianni & Brugnaro Luca

Focus sulla relazione: esempi pratici  

La distribuzione Normale e il test Z: Ipotesi iniziali indipendenza dei dati e identicamente distribuiti (iid), dipende dal disegno di studio ; distribuzione normale dei dati (vedi test sulla normalità) presenza solo di errori campionari (con distribuzione pari ad una normale con media 0 e deviazione std. pari ) assenza di errori sistematici deviazione standard della distribuzione nota pari a sigma  

Distribuzione normale : esempio1   La differenza osservata tra le due medie è statisticamente significativa (alfa=0.01) ?

Esempio 1: sistema di Ipotesi  

Esempio 1: risoluzione e calcoli     sotto H0 Si respinge l’ipotesi nulla

Sintesi della procedura delineata

Esempio 1 : conclusione Poiché il valore empirico di z = 3.85 > zc, con una probabilità dell'1% di commettere un errore di I tipo, si decide di respingere l'ipotesi nulla e di concludere che le donne del campione appartengono ad una popolazione con valori medi di glicemia diversi dalla popolazione presa in esame. Per una stima intervallare della media della popolazione delle gravide padovane, considerando i dati del campione estratto, si procede:  

Esempio 1:stima intervallare n=100 #numerosità del campione > alfa=0.01 > p=1-alfa/2 > media_camp= 83.5 > z=qnorm(p) > sigma=13.5 #se la varianza è conosciuta (requisito per il test) > lim_inf=media_camp - z*sigma/sqrt(n) > lim_sup= media_camp + z*sigma/sqrt(n) > list(lim_inf,lim_sup) [1] 80.02263 [2] 86.97737 Per calcolare la probabilità che si verifichi H0: > pvalue= 2*pnorm(3.85,lower.tail=F) #ipotesi bilaterale > pvalue [1] 0.0001181178

Esempio 2 : il t.test e la distribuzione di T di Student È simmetrica Per campioni elevati si approssima ad una normale standard Media centrata sullo zero La curva si modifica secondo i df

Student t test: Ipotesi iniziali indipendenza dei dati(dipende dal disegno di studio) distribuzione normale dei dati(vedi test sulla normalità) presenza di errori campionari assenza di errori sistematici deviazione standard della distribuzione della popolazione ignota . E’ nota la varianza campionaria corretta (s)

Student T test Calcolo del t osservato Calcolo del t osservato utilizzando R t.test(dati1, (dati2 = può non esserci), alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, var.equal = FALSE, conf.level = 0.95)

Esempio 2 : maschi vs femmine Immaginiamo di aver rilevato i voti degli assaggiatori di sesso diverso, delle birre ottenute con un particolare tipo di malto. Si vuole verificare se il giudizio medio degli assaggiatori è pari a 6 ( la sufficienza) si ponga il livello di significatività pari al 5%, supponendo che la varianza della popolazione non sia nota. Inoltre, il responsabile del marketing vuole verificare se il gradimento della birra non dipende dal sesso dell’assaggiatore. A tale scopo si rilevano i seguenti giudizi per indirizzare la campagna pubblicitaria. # A S 01 7 m 02 8 m 03 9 m 04 8 f 05 9 f 06 7 f 07 6 f 08 7 m 09 8 m 10 5 m Domanda 1 Domanda 2           Indicare un sistema di verifica di ipotesi nel quale la media del gradimento della birra tra gli uomini e maggiore rispetto alle donne

Uso delle tavole il valore critico di t si trova all’incrocio tra la riga 10 e la colonna .025 (considerando i valori sotto l’etichetta «Ipotesi bidirezionale»), si ricorda che la distribuzione della t di Student è simmetrica, quindi i valori positivi e negativi per uno stesso livello di alfa coincidono nel modulo e sono solo differenti nel segno).

Sviluppo e Calcoli Commentare i risultati Media campionaria = = 7,4 Varianza campionaria corretta= = 1,6 Statistica = 3,5 Dalle tavole Y~ t(9,0,025) = 2,262 ; Y~t(9,0,05)= 1,83 Commentare i risultati

Calcoli e sintassi con R creare un dataset > S=factor(c("m","m","m","f","f","f","f","m","m","m")) > A=c(7,8,9,8,9,7,6,7,8,5) > birra2=data.frame(S,A) > birra2 S A 1 m 7 2 m 8 3 m 9 4 f 8 5 f 9 6 f 7 7 f 6 8 m 7 9 m 8 10 m 5 > boxplot(S,A) > boxplot(A~S) > t.test(A~S)

Calcoli con R Domanda 1: test ad un campione > t.test(A,mu=6,alternative="greater") One Sample t-test data: A t = 3.5, df = 9, p-value = 0.003362 alternative hypothesis: true mean is greater than 6 95 percent confidence interval: 6.666755 Inf sample estimates: mean of x 7.4 sd=(sqrt(var(A))) > x=mean(A) > n=10 > mu=6 > toss=(x-mu)/(sd/sqrt(n)) > toss [1] 3.5

Calcoli con r Domanda 2: test a due campioni Welch Two Sample t-test data: A by s t = 0.1954, df = 6.858, p-value = 0.8508 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: -1.859068 2.192401 sample estimates: mean in group f mean in group m 7.500000 7.333333 shapiro.test(A) Shapiro-Wilk normality test W = 0.9297, p-value = 0.4453

In termini pratici… Le tavole forniscono i quantili Si trovano fissando i gradi di libertà e l’errore voluto Si utilizza con un campione ridotto e conoscendo solo la varianza campionaria S²

Esempio 3 : il chisq.test e la distribuzione chi-quadro di Pearson chisq.test permette di verificare se vi è indipendenza tra la variabile identificata sulle righe e quella sulle colonne di una tabella di contingenza (num_righe*num_colonne). I gradi di libertà del test sono pari a (num_righe –1)*(num_colonne -1). Il test richiede l’indipendenza dei dati ma nessuna particolarità sul tipo di distribuzione dei dati. In R: chisq.test(x) Dove x è una tabella di contingenza (le distribuzioni congiunte delle due variabili)

χ² di Pearson  

Esempio 3: la scoperta del secolo Si ipotizza che l’assunzione regolare di vitamina C possa ridurre il rischio di contrarre l’influenza. Per un anno, regolarmente a un gruppo di individui di un campione randomizzato a triplo cieco viene somministrata la Vitamina C e alla parte restante un Placebo. I soggetti vengono dunque seguiti per un anno e alla fine si chiede a ciascuno se hanno contratto l’influenza (modalità = si o no ). Si riportano nella tabella "esperimento" i dati aggregati. esperimento=matrix(c(116,24,115,24),nr=2,dimnames=list(influenza=c("si","no"),trattamento=c("si","no"))) > esperimento influenza trattamento placebo vit C tot NO 116 115 231 SI 24 48 140 139 279

Come procedere Costruire il sistema di ipotesi concettuale Tabella frequenze attese Calcolo del χ² di Pearson Confronto con il valore critico conclusione

Costruire il Sistema di ipotesi l’assunzione regolare di vitamina C può ridurre il rischio di contrarre l’influenza ? l’ipotesi H0 :le variabili sono indipendenti l’ipotesi H1 : vi è qualche forma di relazione tra le variabili

gradi di libertà (n-1)(c-1) il ricercatore ha fissato un valore di alfa pari a .05 formulando un’ipotesi Abbiamo quindi un sistema di ipotesi dove: H0 : indipendenza stocastica H1: relazione tra le variabili  

Tabella delle frequenze «attese» Le frequenze attese sono quei valori che ci aspetteremo nella ipotesi della indipendenza «Stocastica». influenza trattamento placebo vit C tot NO 116 115 231 SI 24 48 140 139 279 influenza trattamento placebo vit C tot NO 115,914 115,086 231 SI 24,08602 23,91398 48 140 139 279 = 0,0007446

…….ancora calcoli trattamento influenza si no si 115.91398 115.08602 chisq.test(esperimento)$expected trattamento influenza si no si 115.91398 115.08602 no 24.08602 23.91398 > chisq.test(esperimento) Pearson's Chi-squared test with Yates' continuity correction data: esperimento X-squared = 0, df = 1, p-value = 1 > chisq.test(esperimento,correct=F) Pearson's Chi-squared test X-squared = 7e-04, df = 1, p-value = 0.9782

Quali conclusioni possiamo trarre dai risultati ottenuti ? fissato un alfa (usualmente 0.05) verifico il p-value rispetto a questo alfa se p-value >= alfa: accetto l’ipotesi H0 (le variabili sono indipendenti) se p-value < alfa: accetto l’ipotesi H1 (vi è qualche forma di relazione tra le variabili) Quali conclusioni possiamo trarre dai risultati ottenuti ?

Grazie per l’attenzione