Intervalli di confidenza Lezione 5 Dr.ssa Sara Balduzzi Università degli Studi di Modena e Reggio Emilia sara.balduzzi@unimore.it
Contenuti della lezione intervallo di confidenza di una media SD nota SD incognita intervallo di confidenza di una proporzione
…è stato introdotto lo z-score… Dove: è la media campionaria è la media nella popolazione SD deviazione standard nella popolazione n la dimensione del campione Errore standard per n grande (o se la variabile di interesse (x) si distribuisce normalmente) la statistica z-score si distribuisce normalmente con media pari a zero e deviazione standard uguale a 1 z~N(0,1)
... ... Intervallo di confidenza di una media: SD nota SD sd1 n sd2 n Popolazione con parametri noti SD Estrazione di campioni di dimensione n x1,x2,x3,…,xn x1,x2,x3,…,xn x1,x2,x3,…,xn x1,x2,x3,…,xn ... sd1 n sd2 n sd3 n sdk n ...
Pr (-1.96<z<1.96)=0.95
che può essere riscritta come... con qualche semplice passaggio algebrico...
... ... SD n n n n Popolazione con parametri noti Estraendo tanti campioni di dimensione n x1,x2,x3,…,xn x1,x2,x3,…,xn x1,x2,x3,…,xn n x1,x2,x3,…,xn ... n n n … calcolando l’intervallo su ogni campione... ... … il 95% di questi intervalli comprenderanno X
La distribuzione t di student NB Invece di considerare la SD della popolazione viene calcolata la sd nel campione Dove: è la media campionaria è la media nella popolazione sd deviazione standard nel campione n la dimensione del campione Stima dell’errore standard
(stimatore della deviazione standard della popolazione) Calcolo della deviazione standard nel campione Ricordando che….. Deviazione standard nella popolazione Deviazione standard nel campione (stimatore della deviazione standard della popolazione) n-1 rappresentano il numero di gradi di libertà
La distribuzione t di student Distribuzione normale standardizzata Distribuzione t di student con n=12 Distribuzione t di student con n=5 Non esiste una sola distribuzione t di student (come per la normale standardizzata), ma una famiglia di distribuzioni di t, dato che la distribuzione si modifica secondo il numero di gradi di libertà (n-1)
che può essere riscritta come... con qualche semplice passaggio algebrico...
Esempio Si vuole conoscere la media della temperatura corporea delle persone sane. Si estrae un campione composto da 106 individui rappresentativi della popolazione delle persone sane. La media della temperatura su tale campione risulta pari a 36 (sd=0.34). L’intervallo di confidenza al 95% è pari a: 95%CI(35.9;36.04) Abbiamo una fiducia del 95% che la temperatura corporea delle persone sane sia compresa fra 35.9 e 36.04
Intervallo di confidenza di una proporzione Popolazione Estrazione di campioni di dimensione n Dove xi può assumere valori 0 oppure 1 x1,x2,x3,…,xn x1,x2,x3,…,xn x1,x2,x3,…,xn x1,x2,x3,…,xn n k2 ... k3 kk k1 n n n Dove k rappresenta il numero di individui (tra gli n del campione) con evento uguale a 1 (numero di eventi osservati)
La distribuzione binomiale
che può essere riscritta come... quindi... Pr (-1.96<z<1.96)=0.95 che può essere riscritta come... con qualche semplice passaggio algebrico...
Esercizio 2 Su un campione di 200 studenti è stato rilevato che il 10% scrive con la mano sinistra. Calcolare l’intervallo di confidenza al 95% della proporzione di studenti che scrivono con la sinistra. (0.058; 0.142)