La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca.

Presentazioni simili


Presentazione sul tema: "I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca."— Transcript della presentazione:

1 I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca

2 F OCUS SULLA RELAZIONE : ESEMPI PRATICI 2

3 L A DISTRIBUZIONE N ORMALE E IL TEST Z: I POTESI INIZIALI indipendenza dei dati e identicamente distribuiti (iid), dipende dal disegno di studio ; distribuzione normale dei dati (vedi test sulla normalità) presenza solo di errori campionari (con distribuzione pari ad una normale con media 0 e deviazione std. pari ) assenza di errori sistematici deviazione standard della distribuzione nota pari a sigma 3

4 D ISTRIBUZIONE NORMALE : ESEMPIO 1 4 La differenza osservata tra le due medie è statisticamente significativa (alfa=0.01) ?

5 5 E SEMPIO 1: SISTEMA DI I POTESI

6 E SEMPIO 1: RISOLUZIONE E CALCOLI sotto H0 6 Si respinge lipotesi nulla

7 S INTESI DELLA PROCEDURA DELINEATA 7

8 E SEMPIO 1 : CONCLUSIONE Poiché il valore empirico di z = 3.85 > zc, con una probabilità dell'1% di commettere un errore di I tipo, si decide di respingere l'ipotesi nulla e di concludere che le donne del campione appartengono ad una popolazione con valori medi di glicemia diversi dalla popolazione presa in esame. Per una stima intervallare della media della popolazione delle gravide padovane, considerando i dati del campione estratto, si procede: 8

9 E SEMPIO 1: STIMA INTERVALLARE n=100 #numerosità del campione > alfa=0.01 > p=1-alfa/2 > media_camp= 83.5 > z=qnorm(p) > sigma=13.5 #se la varianza è conosciuta (requisito per il test) > lim_inf=media_camp - z*sigma/sqrt(n) > lim_sup= media_camp + z*sigma/sqrt(n) > list(lim_inf,lim_sup) [1] [2] Per calcolare la probabilità che si verifichi H0: > pvalue= 2*pnorm(3.85,lower.tail=F) #ipotesi bilaterale > pvalue [1]

10 oÈ simmetrica oPer campioni elevati si approssima ad una normale standard oMedia centrata sullo zero oLa curva si modifica secondo i df E SEMPIO 2 : IL T. TEST E LA DISTRIBUZIONE DI T DI S TUDENT 10

11 S TUDENT T TEST : I POTESI INIZIALI 11 o indipendenza dei dati(dipende dal disegno di studio) o distribuzione normale dei dati(vedi test sulla normalità) o presenza di errori campionari o assenza di errori sistematici o deviazione standard della distribuzione della popolazione ignota. E nota la varianza campionaria corretta (s)

12 S TUDENT T TEST 12 Calcolo del t osservato Calcolo del t osservato utilizzando R t.test(dati1, (dati2 = può non esserci), alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, var.equal = FALSE, conf.level = 0.95)

13 E SEMPIO 2 : MASCHI VS FEMMINE Immaginiamo di aver rilevato i voti degli assaggiatori di sesso diverso, delle birre ottenute con un particolare tipo di malto. Si vuole verificare se il giudizio medio degli assaggiatori è pari a 6 ( la sufficienza) si ponga il livello di significatività pari al 5%, supponendo che la varianza della popolazione non sia nota. Inoltre, il responsabile del marketing vuole verificare se il gradimento della birra non dipende dal sesso dellassaggiatore. A tale scopo si rilevano i seguenti giudizi per indirizzare la campagna pubblicitaria. 13 # A S 01 7 m 02 8 m 03 9 m 04 8 f 05 9 f 06 7 f 07 6 f 08 7 m 09 8 m 10 5 m Indicare un sistema di verifica di ipotesi nel quale la media del gradimento della birra tra gli uomini e maggiore rispetto alle donne Domanda 1Domanda 2

14 U SO DELLE TAVOLE il valore critico di t si trova allincrocio tra la riga 10 e la colonna.025 (considerando i valori sotto letichetta «Ipotesi bidirezionale»), si ricorda che la distribuzione della t di Student è simmetrica, quindi i valori positivi e negativi per uno stesso livello di alfa coincidono nel modulo e sono solo differenti nel segno). 14

15 S VILUPPO E C ALCOLI Media campionaria = = 7,4 Varianza campionaria corretta= = 1,6 Statistica = 3,5 Dalle tavole Y~ t(9,0,025) = 2,262 ; Y~t(9,0,05)= 1,83 15 Commentare i risultati

16 C ALCOLI E SINTASSI CON R CREARE UN DATASET 16 > S=factor(c("m","m","m","f","f","f","f","m","m","m")) > A=c(7,8,9,8,9,7,6,7,8,5) > birra2=data.frame(S,A) > birra2 S A 1 m 7 2 m 8 3 m 9 4 f 8 5 f 9 6 f 7 7 f 6 8 m 7 9 m 8 10 m 5 > boxplot(S,A) > boxplot(A~S) > t.test(A~S)

17 C ALCOLI CON R D OMANDA 1: TEST AD UN CAMPIONE > t.test(A,mu=6,alternative="greater") One Sample t-test data: A t = 3.5, df = 9, p-value = alternative hypothesis: true mean is greater than 6 95 percent confidence interval: Inf sample estimates: mean of x 7.4 sd=(sqrt(var(A))) > x=mean(A) > n=10 > mu=6 > toss=(x-mu)/(sd/sqrt(n)) > toss [1]

18 C ALCOLI CON R D OMANDA 2: TEST A DUE CAMPIONI Welch Two Sample t-test data: A by s t = , df = 6.858, p-value = alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: sample estimates: mean in group f mean in group m shapiro.test(A) Shapiro-Wilk normality test W = , p-value =

19 I N TERMINI PRATICI … Le tavole forniscono i quantili Si trovano fissando i gradi di libertà e lerrore voluto Si utilizza con un campione ridotto e conoscendo solo la varianza campionaria S² 19

20 E SEMPIO 3 : IL CHISQ. TEST E LA DISTRIBUZIONE CHI - QUADRO DI P EARSON chisq.test permette di verificare se vi è indipendenza tra la variabile identificata sulle righe e quella sulle colonne di una tabella di contingenza (num_righe*num_colonne). I gradi di libertà del test sono pari a (num_righe –1)*(num_colonne -1). Il test richiede lindipendenza dei dati ma nessuna particolarità sul tipo di distribuzione dei dati. In R: chisq.test(x) Dove x è una tabella di contingenza (le distribuzioni congiunte delle due variabili) 20

21 Χ ² DI P EARSON 21

22 E SEMPIO 3: LA SCOPERTA DEL SECOLO Si ipotizza che lassunzione regolare di vitamina C possa ridurre il rischio di contrarre linfluenza. Per un anno, regolarmente a un gruppo di individui di un campione randomizzato a triplo cieco viene somministrata la Vitamina C e alla parte restante un Placebo. I soggetti vengono dunque seguiti per un anno e alla fine si chiede a ciascuno se hanno contratto linfluenza (modalità = si o no ). Si riportano nella tabella "esperimento" i dati aggregati. 22 esperimento=matrix(c(116,24,115,24),nr=2,dimnames=list(i nfluenza=c("si","no"),trattamento=c("si","no"))) > esperimento influenza trattamento placebovit C tot NO SI24 48 tot

23 C OME PROCEDERE Costruire il sistema di ipotesi concettuale Tabella frequenze attese Calcolo del χ² di Pearson Confronto con il valore critico conclusione 23

24 C OSTRUIRE IL S ISTEMA DI IPOTESI lipotesi H0 :le variabili sono indipendenti lipotesi H1 : vi è qualche forma di relazione tra le variabili 24 lassunzione regolare di vitamina C può ridurre il rischio di contrarre linfluenza ?

25 gradi di libertà (n-1)(c-1) il ricercatore ha fissato un valore di alfa pari a.05 formulando unipotesi Abbiamo quindi un sistema di ipotesi dove: H0 : indipendenza stocastica H1: relazione tra le variabili 25

26 T ABELLA DELLE FREQUENZE « ATTESE » Le frequenze attese sono quei valori che ci aspetteremo nella ipotesi della indipendenza «Stocastica». 26 = 0, influenza trattamento placebovit C tot NO SI24 48 tot influenza trattamento placebovit C tot NO115,914115, SI24, , tot

27 ……. ANCORA CALCOLI chisq.test(esperimento)$expected trattamento influenza si no si no > chisq.test(esperimento) Pearson's Chi-squared test with Yates' continuity correction data: esperimento X-squared = 0, df = 1, p-value = 1 > chisq.test(esperimento,correct=F) Pearson's Chi-squared test data: esperimento X-squared = 7e-04, df = 1, p-value =

28 CONCLUSIONI fissato un alfa (usualmente 0.05) verifico il p-value rispetto a questo alfa se p-value >= alfa: accetto lipotesi H0 (le variabili sono indipendenti) se p-value < alfa: accetto lipotesi H1 (vi è qualche forma di relazione tra le variabili) 28 Quali conclusioni possiamo trarre dai risultati ottenuti ?

29 Grazie per lattenzione 29


Scaricare ppt "I NTERPRETAZIONE DEI FENOMENI IN AMBITO SANITARIO : DAL CAMPIONE ALLA POPOLAZIONE E SERCITAZIONI DI I NFERENZA S TATISTICA Boscaro Gianni & Brugnaro Luca."

Presentazioni simili


Annunci Google