DALL'INTERVALLO DI PROBABILITÀ ALL'INTERVALLO DI CONFIDENZA
INTERVALLO DI PROBABILITÀ Poiché, per campioni di numerosità suffi-ciente, lo stimatore media campionaria ha distribuzione gaussiana N~ (, 2/n), possiamo calcolare la probabilità che una data media campionaria ( ) ha di apparte-nere ad un certo intorno della media vera della variabile casuale . L'intervallo zα/2 σ/n , simmetrico attorno alla media vera (μ), include una frazione (1- α) delle possibili medie campionarie. Quindi la probabilità di ottenere una media campionaria ap-partenente a tale intervallo è (1-α).
dall'intervallo di probabilità all'intervallo di confidenza Quanto detto può essere espresso nei seguenti termini: dall'intervallo di probabilità all'intervallo di confidenza Questo intervallo ha ampiezza nota (se si suppone nota la dispersione ), ed è centrato sull'ignoto parametro . Tale intervallo viene detto intervallo di probabilità. La precedente espressione può essere riarrangiata, con un poco di algebra, come segue: Questo intervallo ha ampiezza nota ed è centrato su una media campionaria nota. Tale intervallo viene detto : intervallo di confidenza per il parametro .
intervallo di confidenza per il parametro . La posizione dell'intervallo di confidenza sull'asse reale dipende dalla variabile casuale media campionaria : L'intervallo di confidenza varia casualmente attorno al parametro, ed ha probabilità pari a (1-a) di includere il parametro della variabile Ciò significa che, benché sia impossibile risa-lire da una stima campionaria al vero valore del parametro di un universo, è però possibile determinare attorno a tale stima un intervallo che ha una prefissata probabilità (1-α) di includere il parametro di quell'universo.
ampiezza dell’intervallo di confidenza L’ampiezza confidenza esprime l'indeterminazione con cui è noto il valore del parametro. Tale ampiezza dipende dall'errore standard che a sua volta dipende dalla dimensione (n) del campione. Pertanto, per una data dispersione (s) tipica dell'universo da cui voglio estrarre un campione, è possibile calcolare la dimensione del campione necessaria per ottenere un intervallo di prefissata confidenza (1-a) e ampiezza 2D:
Esempio: Si vuole stimare il vero valore medio dell'uricemia in una popolazione maschile: è noto che in tale popolazione la dispersione dell'uricemia è s = 1.1 mg/dl. Si richiede che la confidenza sia del 95% e che l'indeter-minazione non ecceda 0.35 mg/dl. La dimensione necessaria a soddisfare tali specifiche è n = ( 1.96 × 1.1 / 0.35)2 = 37.9 … quindi … n = 40 soggetti
intervallo di confidenza per il parametro . Si supponga ora di estrarre un campione casuale di 40 soggetti dalla popolazione, di determinare il valore di uricemia di ognuno dei 40 soggetti, e di calcolare la media di tali valori (ad es. =5.55 mg/dl). Si ricava che l'intervallo di confidenza della media al 95% vale I.C.95% = 5.55 ± 1.96 x 1.1/√40 = 5.55 ± 0.34 = (5.21 , 5.89) Cosa posso concludere? Posso affermare che il parametro ignoto è compreso tra 5.21 e 5.89 mg/dl, ed ho la quasi certezza (cioè la confidenza del 95%) che l'affermazione sia vera. Nel contempo, so bene che l'affermazione potrebbe anche essere falsa (vi è infatti la probabilità del 5% che l'intervallo non includa il parametro ), ma ritengo che tale deprecabile eventualità sia così poco probabile da non capitare proprio a me.
Esempio Domanda: Qual è la pressione arteriosa di maschi di età 45-64 maschi ? Si è misurata la pressione arteriosa a 36 uomini di età compresa tra i 45 e i 64 anni selezionati a caso a partire dalla lista dei pazienti di un medico di base. Si è trovato che la pressione sistolica calcolata sul campione è 144 mmHg. a) Calcolare l’intervallo di confidenza al 95% per la pressione sistolica media, sapendo che σ=24.0 mmHg. b) Utilizzate il risultato ottenuto per saggiare se la pressione sistolica media degli uomini della fascia di età 45-64 anni può essere considerata pari a 150 mmHg DATI … =144 mmHg. ; σ=24 mmHg ; (1-α)=0.95 ; z0.025=1.96
Risposta: La pressione arteriosa di maschi di età 45-64 maschi I.C. (μ) =1441.9624/36 = 1441.964 = 1447.84 = [136.16;151.84] b) Per quanto osservato in questo campione di 36 uomini di età compresa tra 45 e 64 anni, possiamo inferire quanto segue: la pressione sitolica media degli uomini nella fascia di età 45-64 anni è un valore qualunque compreso tra 136.16 e 151.84 mmHg. La probabilità che tale affermazione sia vera è pari al 95%. Ne consegue che 150 mmHg può essere considerato uno dei valori plausibili per la pressione sistolica medlia degli uomini in quella fascia di età.
Di seguito sono riportati i valori di colesterolo (mg/100ml) di un campione di 11 uomini estratti a caso da un’ampia popolazione: «265, 208, 361, 143, 310, 252, 239, 225, 184, 220, 332» COLESTEROLO Calcolate l’intervallo di confidenza al 99% per il valore medio del colesterolo nella popolazione sapendo che σ= 65 mg/100ml (ed assumendo che il livello di colesterolo abbia distribuzione gaussiana). DATI : = 249 mg/100ml; σ=65 mg/100ml; (1-α)=0.99; z0.005=2.58 I.C. = 249 2.5865/11 = = 249 2.5819.60 = 249 50.56 [198.44;299.56]
IMA Dati: =240 mg/dl =40mg/dl n=100 In una popolazione di uomini che ha avuto un in-farto al miocardio, il livello di colesterolo media-mente è 240 mg/dl con una deviazione standard di 40 mg/dl. Estraendo casualmente un campione di 100 soggetti si è trovata una media di 235 mg/dl. IMA 1 Quale è la probabilità che il livello medio di colesterolo sia maggiore o uguale a 260 mg/dl? 2. Qual è l’intervallo di confidenza per la media della popolazione ad un livello del 95%? Dati: =240 mg/dl =40mg/dl n=100 1. 2. I.C(μ) = 2351.9640/100= 235 1.964 = 235 7.84 [227.16;242.84]
L'indice di massa corporea, BMI, (Kg/m2) misura il grado di sovrappeso di un soggetto. Per la popolazione di uomini di mezza età che svilupperanno diabete mellito, la distribuzione di BMI ha forma approssimativamente gaussiana con media non nota e deviazione standard =2.7 kg/m². Un campione casuale di 58 soggetti selezionati da questo gruppo ha fornito una media =25kg/m². BMI a) Calcolare l’intervallo di confidenza al 95% per la media della popolazione. =2.7kg/m² =0.05 n=58 =25 kg/m² b) Se si richiedesse una confidenza del 99%, quale dimensione del campione garantirebbe una ampiezza dell’intervallo pari a quella trovata al punto a)? n =(6.291/0.69)2 83