Intervallo di probabilità di una media Intervallo di confidenza di una media. Esercitazione
PROBLEMA n° 1 Per valutare l'efficacia della somministrazione di Ferro nella prevenzione dell'anemia sideropenica, si è trattato il 20% delle ragazze che frequentano la scuola secondarie con 1 compressa/die di solfato ferroso per 12 settimane consecutive. Al termine dello studio la distribuzione dei livelli di emoglobina (Hb) aveva media T=140 g/l e deviazione standard T=10 g/l per le ragazze trattate, e media C=131 g/l e deviazione standard C=12 g/l per le ragazze non trattate. Nell'ipotesi che la distribuzione dell'emoglobina sia gaussiana, calcola:
La probabilità che una ragazza abbia livelli di Hb minori di 125 g/l. Domande Risposte La probabilità che una ragazza trattata abbia livelli di Hb minori di 125 g/l. z=(125-mT)/sT = (125-140)/10 = -1.5 p(Hb<125) = F(-1.5) = 0.0668 La probabilità che una ragazza non trattata abbia livelli di Hb < 125 g/l. z=(125-mC)/sC=(125-131)/12= -0.5 p(Hb<125) = F(-0.5) = 0.3085 La probabilità che una ragazza abbia livelli di Hb minori di 125 g/l. = fT*pT+fC*pC = (0.0668)(0.20) +(0.3085)(0.80) = 0.260 La probabilità che una ragazza con livelli di Hb < 125 g/l sia stata trattata. p(trattata|Hb<125) = p(trattata&Hb<125)/p(Hb<125) = 0.0668 / 0.260 = 0.2569 La probabilità che la media dei livelli di Hb di 16 ragazze non trattate sia <125 g/l. z =(125-mC)/(sC/16) =(125-131)/(12/4) = -2.0 p(media(Hb)<125)= F(-2.0) = 0.0228 F(z*) è la funzione che stima l’area sotto la Gaussaina per [–inf<z<z*]
PROBLEMA n° 2 Nel Framingham Study, sono stati misurati i livelli di colesterolo totale sierico in una coorte di 475 soggetti maschi di età 40-49 anni ed in buona salute. La coorte è stata poi seguita per sedici anni. Alla fine di questo periodo, i soggetti sono stati divisi in due gruppi: 1) coloro che non avevano sviluppato malattie coronariche 354 (normali). 2) coloro che avevano sviluppato malattie coronariche 121 (malati). La distribuzione dei livelli di colesterolo sierico nei due gruppi (all’inizio dello studio) era stata trovata approssimativamente gaussiana - con media m1= 219 mg/dl e dev.stand. s1= 41 mg/dl nei soggetti che NON hanno poi sviluppato malattia - con media m2= 244 mg/dl e dev.stand. s2= 51 mg/dl nei soggetti che hanno poi sviluppato la malattia e (MacMahon SW, McDonald GJ: A population at risk: prevalence of high cholesterol levels in hypertensive patients in Framingham Study,(1986) Am.J.Med.Sup.:80:40-47)
Determinare l’intervallo di confidenza al 95% del livello di colesterolo sierico per coloro che hanno sviluppato la malattia coronaria C.I.=[244 (1.96)(51)/121] =[ 234.9 ; 253.1] l’intervallo di confidenza al 95% del livello di colesterolo sierico per coloro che NON hanno sviluppato la malattia coronaria C.I.=[219 (1.96)(41)/354] =[ 214.8 ; 223.2] con quale probabilità svilupperà la malattia coronarica, in base alle informazioni disponibili, un soggetto di età 45 anni aveva un livello di colesterolo sierico totale pari a 250 mg/dl p1=1-F[(250-219)/41]= 0.224 p2=1-F[(250-244)/51]= 0.453 p3= p2/(p1+p2) = 0.668 VP=p2 FP=p1
PROBLEMA n° 3 La concentrazione di colesterolo sierico in pazienti diabetici è una variabile casuale [distribuita ~ gaussiana] con media μ=210 mg/dl e ds. σ=40 mg/dl. Un'indagine condotta su un campione di 925 pazienti lombardi affetti dalla malattia ha fornito i seguenti risultati. n min max Media ds. 10% 25% 50% 75% 90% 735 70 381 212.8 40.7 165 186 211 238 266 a) Quali tra i valori riportati in tabella sono utili (e perché) per, una verifica empirica della gaussianità della concentrazione di colesterolo sierico ? b) Se la distribuzione della concentrazione di colesterolo sierico è gaussiana, in quale inter-vallo simmetrico attorno alla media si colloca la concentrazione di colesterolo sierico del 95% dei pazienti? c) in quale intervallo simmetrico attorno alla media di collaca il 95% delle medie campionarie della concentrazione di colesterolo sierico in lombardia? d) Qual è la differenza di significato tra l'intervallo calcolato al punto (b) e quello calcolato al punto (c)? e) In base a quanto ottenuto al punto (d) si può ritenere che il livello medio di concentrazione di colesterolo sierico osservato nei pazienti nati in Lombardia sia significativamente diverso da quello della popolazione dei pazienti diabetici?. (NON eseguire calcoli).
Obs Mean Std. Err. [95% Conf. Interval] Colesterplo: valori osservati nel campione di 735 soggetti Percentiles Smallest 1% 127 70 5% 154 80 10% 165 92 Obs 735 25% 185 109 50% 211 Mean 212.7932 Largest Std. Dev. 40.75046 75% 238 343 Variance 1660.6 90% 266 349 95% 286 379 Skewness .405623 99% 323 381 Kurtosis 3.905547 Obs Mean Std. Err. [95% Conf. Interval] 735 212.79 1.503086 209.8391 215.7409
Media 212.8 d.s. 40.7 (attesi: Media 210 d.s. 40 ) n Percentili 70 10% 25% 50% 75% 90% 381 735 Osservati 165 186 211 238 266 100 %cumul. attesa 0.00 3.04 8.85 23.42 48.01 74.22 99.98