La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

DALL'INTERVALLO DI PROBABILITÀ

Presentazioni simili


Presentazione sul tema: "DALL'INTERVALLO DI PROBABILITÀ"— Transcript della presentazione:

1 DALL'INTERVALLO DI PROBABILITÀ
ALL'INTERVALLO DI CONFIDENZA

2 INTERVALLO DI PROBABILITÀ
Poiché, per campioni di numerosità suffi-ciente, lo stimatore media campionaria ha distribuzione gaussiana N~ (, 2/n), possiamo calcolare la probabilità che una data media campionaria ( ) ha di apparte-nere ad un certo intorno della media vera della variabile casuale . L'intervallo zα/2 σ/n , simmetrico attorno alla media vera (μ), include una frazione (1- α) delle possibili medie campionarie. Quindi la probabilità di ottenere una media campionaria ap-partenente a tale intervallo è (1-α).

3 dall'intervallo di probabilità all'intervallo di confidenza
Quanto detto può essere espresso nei seguenti termini: dall'intervallo di probabilità all'intervallo di confidenza Questo intervallo ha ampiezza nota (se si suppone nota la dispersione ), ed è centrato sull'ignoto parametro . Tale intervallo viene detto intervallo di probabilità. La precedente espressione può essere riarrangiata, con un poco di algebra, come segue: Questo intervallo ha ampiezza nota ed è centrato su una media campionaria nota. Tale intervallo viene detto :  intervallo di confidenza per il parametro . 

4  intervallo di confidenza per il parametro . 
La posizione dell'intervallo di confidenza sull'asse reale dipende dalla variabile casuale media campionaria : L'intervallo di confidenza varia casualmente attorno al parametro, ed ha probabilità pari a (1-a) di includere il parametro della variabile Ciò significa che, benché sia impossibile risa-lire da una stima campionaria al vero valore del parametro di un universo, è però possibile determinare attorno a tale stima un intervallo che ha una prefissata probabilità (1-α) di includere il parametro  di quell'universo.

5 ampiezza dell’intervallo di confidenza
L’ampiezza confidenza esprime l'indeterminazione con cui è noto il valore del parametro. Tale ampiezza dipende dall'errore standard che a sua volta dipende dalla dimensione (n) del campione. Pertanto, per una data dispersione (s) tipica dell'universo da cui voglio estrarre un campione, è possibile calcolare la dimensione del campione necessaria per ottenere un intervallo di prefissata confidenza (1-a) e ampiezza 2D:

6 Esempio: Si vuole stimare il vero valore medio dell'uricemia in una popolazione maschile: è noto che in tale popolazione la dispersione dell'uricemia è s = 1.1 mg/dl. Si richiede che la confidenza sia del 95% e che l'indeter-minazione non ecceda 0.35 mg/dl. La dimensione necessaria a soddisfare tali specifiche è n = ( 1.96 × 1.1 / 0.35)2 = 37.9 … quindi … n = 40 soggetti

7  intervallo di confidenza per il parametro . 
Si supponga ora di estrarre un campione casuale di 40 soggetti dalla popolazione, di determinare il valore di uricemia di ognuno dei 40 soggetti, e di calcolare la media di tali valori (ad es. =5.55 mg/dl). Si ricava che l'intervallo di confidenza della media al 95% vale I.C.95% = 5.55 ± 1.96 x 1.1/√40 = 5.55 ± 0.34 = (5.21 , 5.89) Cosa posso concludere? Posso affermare che il parametro ignoto  è compreso tra 5.21 e 5.89 mg/dl, ed ho la quasi certezza (cioè la confidenza del 95%) che l'affermazione sia vera. Nel contempo, so bene che l'affermazione potrebbe anche essere falsa (vi è infatti la probabilità del 5% che l'intervallo non includa il parametro ), ma ritengo che tale deprecabile eventualità sia così poco probabile da non capitare proprio a me.

8 Esempio Domanda: Qual è la pressione arteriosa di maschi di età 45-64 maschi ?
Si è misurata la pressione arteriosa a 36 uomini di età compresa tra i 45 e i 64 anni selezionati a caso a partire dalla lista dei pazienti di un medico di base. Si è trovato che la pressione sistolica calcolata sul campione è 144 mmHg. a) Calcolare l’intervallo di confidenza al 95% per la pressione sistolica media, sapendo che σ=24.0 mmHg. b) Utilizzate il risultato ottenuto per saggiare se la pressione sistolica media degli uomini della fascia di età anni può essere considerata pari a 150 mmHg DATI … =144 mmHg. ; σ=24 mmHg ; (1-α)=0.95 ; z0.025=1.96

9 Risposta: La pressione arteriosa di maschi di età 45-64 maschi
I.C. (μ) =1441.9624/36 = 1441.964 = 1447.84 = [136.16;151.84] b) Per quanto osservato in questo campione di 36 uomini di età compresa tra 45 e 64 anni, possiamo inferire quanto segue: la pressione sitolica media degli uomini nella fascia di età anni è un valore qualunque compreso tra e mmHg. La probabilità che tale affermazione sia vera è pari al 95%. Ne consegue che 150 mmHg può essere considerato uno dei valori plausibili per la pressione sistolica medlia degli uomini in quella fascia di età.

10 Di seguito sono riportati i valori di colesterolo (mg/100ml) di un campione di 11 uomini estratti a caso da un’ampia popolazione: «265, 208, 361, 143, 310, 252, 239, 225, 184, 220, 332» COLESTEROLO Calcolate l’intervallo di confidenza al 99% per il valore medio del colesterolo nella popolazione sapendo che σ= 65 mg/100ml (ed assumendo che il livello di colesterolo abbia distribuzione gaussiana). DATI : = 249 mg/100ml; σ=65 mg/100ml;  (1-α)=0.99; z0.005=2.58 I.C. = 249  2.5865/11 = = 249  2.5819.60 = 249   [198.44;299.56]

11 IMA Dati: =240 mg/dl =40mg/dl n=100
In una popolazione di uomini che ha avuto un in-farto al miocardio, il livello di colesterolo media-mente è 240 mg/dl con una deviazione standard di 40 mg/dl. Estraendo casualmente un campione di 100 soggetti si è trovata una media di 235 mg/dl. IMA 1 Quale è la probabilità che il livello medio di colesterolo sia maggiore o uguale a 260 mg/dl? 2. Qual è l’intervallo di confidenza per la media  della popolazione ad un livello del 95%? Dati: =240 mg/dl =40mg/dl n=100 1. I.C(μ) = 2351.9640/100= 235  1.964 = 235  7.84 [227.16;242.84]

12 L'indice di massa corporea, BMI, (Kg/m2) misura il grado di sovrappeso di un soggetto. Per la popolazione di uomini di mezza età che svilupperanno diabete mellito, la distribuzione di BMI ha forma approssimativamente gaussiana con media  non nota e deviazione standard =2.7 kg/m². Un campione casuale di 58 soggetti selezionati da questo gruppo ha fornito una media =25kg/m². BMI a) Calcolare l’intervallo di confidenza al 95% per la media della popolazione. =2.7kg/m² =0.05 n=58 =25 kg/m² b) Se si richiedesse una confidenza del 99%, quale dimensione del campione garantirebbe una ampiezza dell’intervallo pari a quella trovata al punto a)? n =(6.291/0.69)2  83


Scaricare ppt "DALL'INTERVALLO DI PROBABILITÀ"

Presentazioni simili


Annunci Google