Matematica e statistica Versione didascalica: parte 7 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste
Variabili aleatorie gaussiane Esperimento E, si esegue una misura X (risultato: un numero x) Sul risultato influiscono N cause di errore indipendenti Ciascuna causa produce un + oppure un – La misura risulta dove S k vale –1 oppure +1 con uguali probabilità del 50%. Di fatto, X può assumere un numero finito = 2N+1 di valori da fino a ed è come se fosse una v.a. finita con moltissimi valori.
Si misura la temperatura corporea umana (valore vero = 37°) Supponiamo N = 45 cause indipendenti ciascuna delle quali possa spostare la misura di = 2/100 di grado. Facciamo m = 99 misure: ad esempio 37.18, 36.86, 37.1, 37.1, 36.86, 37.06, 37.1, …. calcolano le frequenze relative a passo 0.1, e generiamo lareogramma Calcoliamo anche le stime puntuali per e
Teorema Limite Centrale (caso speciale delle misure) Lareogramma delle misure sperimentali ripetute un gran numero m di volte approssima il sottografico della funzione = PDFnorm(, )
Eseguendo con Mathematica m = 2500 misure di X, ammettendo che su ogni misura influiscano N = 450 cause ciascuna delle quali possa spostare la misura dal valore vero di 37 per un = 0.002, otteniamo, con un areogramma a 16 barre:
Ricordiamo che in un areogramma larea di una barra è la probabilità (frequenza relativa) di osservare un valore nella classe che costituisce la base della barra. Essendo che il cadere in barre diverse sono eventi incompatibili, le probabilità si sommano. Per la regola dei rettangoli (calcolo approssimato di integrali) la probabilità di osservare un valore di una misura sperimentale X in un intervallo [a, b] è (approssimativamente) dove e sono il valore atteso e la deviazione standard di X
Una v.a. X è una Normale (, ) – i parametri –, se la probabilità di osservare un suo valore x fra a e b è data da Introduciamo la antiderivata (Teorema di Torricelli) che in vale 1/2 Per una Normale (, )
(x) = densità (x) = antiderivata della densità tale che (0) = ½ = 50%
Applicazione alla media campionaria
Popolazioni normali Useremo il TLC per la stima intervallare del valore atteso di una popolazione normale
Popolazioni normali P = 90% u = P = 95% u = P = 99% u =
= 95% u =
Se è noto Abbiamo per esempio (valore osservato della media campionaria con n = 250 prove) Se è noto (per esempio = 0.45) Con u = (dalle tavole della normale standard) Segue esercitazione con R
Esercitazione con noto > mu <- 40 > sigma <- 3.5 > u <- qnorm(0.975,0,1) > u [1] > n <- 5 > rnorm(n,mu,sigma) -> x > x [1] > m <- mean(x) > c(m-u*sigma/sqrt(n),m+u*sigma/sqrt(n)) [1] = % 95% 2.5%
Esercitazione con noto > n <- 20 > rnorm(n,mu,sigma) -> x > m <- mean(x) > c(m-u*sigma/sqrt(n),m+u*sigma/sqrt(n)) [1] > n <- 300 > rnorm(n,mu,sigma) -> x > m <- mean(x) > c(m-u*sigma/sqrt(n),m+u*sigma/sqrt(n)) [1]
Se è ignoto Se è ignoto, semplicemente si sostituisce nella procedura precedente con la sua stima (valore osservato sul campione della deviazione standard non distorta, ( diviso per n – 1 ) In luogo della distribuzione normale standard si usa la t di Student con df = n – 1 gradi di libertà (n = dimensione del campione) Se df 30 si ha: t di Student normale standard N(0, 1) Se df < 30 ( piccoli campioni ) si deve usare la t di Student. Vedi esercitazione con R
Esercitazione con ignoto > n <- 5 > rnorm(n,mu,sigma) -> x > m <- mean(x) > sigma <- sd(x) > u <- qt(.975,n-1) = > c(m-u*sigma/sqrt(n),m+u*sigma/sqrt(n)) [1] > n <- 20 > rnorm(n,mu,sigma) -> x > m <- mean(x) > sigma <- sd(x) > u <- qt(.975,n-1)= > c(m-u*sigma/sqrt(n),m+u*sigma/sqrt(n)) [1]
Esercitazione con ignoto > n <- 300 > rnorm(n,mu,sigma) -> x > m <- mean(x) > sigma <- sd(x) > u <- qt(.975,n-1) = > c(m-u*sigma/sqrt(n),m+u*sigma/sqrt(n)) [1]
Popolazioni t con df = 11 P = 90% u = ( ) P = 95% u = ( ) P = 99% u = ( )
Confronto con le popolazioni normali P = 90% u = P = 95% u = P = 99% u =