Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoMassimiliano Grosso Modificato 7 anni fa
1
Intervalli di Fiducia Introduzione Intervalli di fiducia per la media – Caso varianza nota Intervalli di fiducia per la media – Caso varianza non nota Intervalli di fiducia: coefficienti di regressione lineare Intervalli di fiducia: previsioni modello lineare Intervalli di fiducia: coefficienti di regressione multilineare Regioni congiunte di fiducia per i coefficienti di regressione 1
2
Intervalli di fiducia Intervalli di fiducia - Media aritmetica
3
Intervalli di fiducia Intervalli di Fiducia Introduzione Determinare l’intervallo di fiducia di una grandezza misurata , equivale alla determinazione di due numeri e , tali che includano il valore vero con “certezza”. Si è visto comunque che non è possibile, da un campione finito di dati sperimentali, trarre delle conclusioni riguardo alla popolazione che siano sicure al 100 % E’ possibile stabilire però un intervallo in cui il valore vero ha probabilità molto elevata (esempio: 95% o 99%) di cadere. 3
4
Intervalli di fiducia Intervalli di Fiducia Procedura Si sceglie una probabilità vicina a 1. Tale probabilità prende il nome di livello di fiducia. Si determinano quindi due quantità e tali che la probabilità che e racchiudano il valore esatto sia eguale a . L’intervallo di estremi e si chiama intervallo di fiducia e si indica con il simbolo: 4
5
Intervalli di fiducia Intervalli di Fiducia Procedura Scegliere = 95% equivale a dire che, in presenza di un dato campione di dati, c’è una probabilità del 95% che il valore vero ricada nell’intervallo determinato. La scelta di implica una differente ampiezza dell’intervallo di fiducia calcolato. All’aumentare di , quale è il comportamento della “larghezza” dell’intervallo di fiducia? 5
6
Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Caso varianza nota Sia dato un certo campione di dati sperimentali Ipotesi: – Tutte le grandezze misurate sono caratterizzate dalla stessa variabile aleatoria (eguale media e varianza) e sono indipendenti. – La varianza della variabile aleatoria è nota (per esempio da pregresse misure) – La media, invece, è ignota. 6
7
Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota La determinazione dell’intervallo di fiducia passa per i seguenti punti: 1.Scegliere un livello di fiducia 2.Calcolare il valore c tale che: 3.Calcolare 1.L’intervallo di fiducia per la popolazione sarà: 7 dove F è la distribuzione cumulativa della normale di tipo standard, ovvero X ~ N(0,1)
8
Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota Gli n campioni dei dati sperimentali possono essere visti come n singole osservazioni della stessa variabile aleatoria Y (con eguale distribuzione, eguale varianza, eguale media). La variabile media del campione è quindi una variabile aleatoria di media e varianza 2 /n. La variabile aleatoria È una variabile aleatoria normale di tipo standard. 8
9
Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota 9
10
Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota 10 Questo passaggio merita un po’ di attenzione! (riflettere sulle VA in gioco)
11
Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota Importante: Nella diseguaglianza è sempre costante. È l’intervallo di fiducia che varia con il campione. Per chiarire il concetto, si consideri il caso (poco realistico) in cui si abbia la conoscenza della popolazione in termini di media e varianza. La popolazione sia, per esempio, di tipo Gaussiano con media e varianza: Si prelevi da questa popolazione un campione di 10 elementi per cui la variabile aleatoria media sia:
12
Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota Se uno statistico ripete il calcolo dell’intervallo di fiducia più volte (ovviamente su campioni differenti): … Intervalli di fiducia calcolati Solo una volta su 20 l’intervallo di fiducia non racchiude il valore vero
13
Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota L’intervallo di fiducia rappresenta un intervallo di numeri reali in cui ricada il valore vero della media (), con una probabilità pari al 95%. Nel caso in cui l’intervallo di fiducia sia del 99%, l’intervallo è più grande o più piccolo di quello determinato precedentemente? Quale sarebbe l’intervallo di confidenza per un livello del 100%? 13
14
Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota All’aumentare del numero di prove, la varianza della media aritmetica (ovvero l’incertezza nella stima) decresce L’intervallo di valori in cui sono più ricorrenti le stime per la media aritmetica si restringe: c 1 c 1 c 2 c 2
15
Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota Come valutare lo spessore c dell’intervallo di fiducia La costante c può essere valutata dalla seguente probabilità: Essendo X la variabile aleatoria Gaussiana standard (di media 0 e varianza 1) cc 0.91.645 0.951.960 0.992.576 0.9993.291 Valori tipici di c per differenti livelli di fiducia =0.95 =0.99
16
Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza non nota Il calcolo dell’intervallo di fiducia emerge in maniera naturale dalla natura Gaussiana dello stimatore media aritmetica Tale derivazione è possibile grazie alla conoscenza pregressa della varianza dell’errore sperimentale Nella realtà, questo è raramente possibile e si conosce solo una stima della varianza dell’errore sperimentale: Tale eventualità implica un’ulteriore sorgente di incertezza da tenere in conto nel calcolo dell’intervallo di fiducia In maniera intuitiva, dovremmo considerare degli intervalli più ampi di quelli registrati nel caso di conoscenza della varianza
17
Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza non nota 17
18
Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza non nota La variabile aleatoria: È una variabile normale di tipo standard Si è gia visto che lo stimatore imparziale varianza s 2 può essere correlata ad una variabile aleatoria 2 a n-1 gradi di libertà : 18
19
Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza non nota In conclusione la variabile aleatoria: È una variabile aleatoria di tipo T di student ad n -1 gradi di libertà Il passaggio alla T di student è necessario per la semplificazione della varianza ignota. 19
20
Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza non nota Campione di risultati sperimentali come esito di una variabile aleatoria di tipo T di student (una volta nota la media dei dati sperimentali e la varianza stimata). È possibile quindi determinare quale è la probabilità che tale variabile assumi valori compresi in un certo intervallo. 20
21
Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza non nota È necessario quindi determinare, data la simmetria della distribuzione, un numero c tale che Data la simmetria della distribuzione, F(-c) = 1-F(c) e quindi Da cui 21
22
Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza non nota Proprietà distribuzione T di student: La distribuzione T di student è generalmente più larga della distribuzione normale di tipo standard. Pertanto ci attendiamo un intervallo di ampiezza più grande, rispetto al caso in cui la varianza sia nota in modo esatto. 22 r
23
Intervalli di fiducia Intervalli di fiducia per stimatori statistici generici. 23
24
Intervalli di fiducia Intervalli di fiducia per: Coefficienti di regressione lineare Oltre alle stime puntuali sui coefficienti di regressione è possibile valutare un intervallo di fiducia per i coefficienti stimati della regressione. Lo “spessore” dell’intervallo di fiducia è una misura della qualità della regressione. 24
25
Intervalli di fiducia Intervalli di fiducia per: Coefficienti di regressione lineare Nel caso della regressione lineare, è necessaria una stima imparziale della varianza dell’errore sperimentale: In parecchi libri di testo tale espressione prende anche il nome di Errore Quadratico Medio (in inglese: Mean Square Errore, acronimo MSE) 25
26
Intervalli di fiducia Intervalli di fiducia per: Coefficienti di regressione lineare Si è gia visto che gli stimatori b 0 e b 1 sono variabili aleatorie Gaussiane (se gli errori sperimentali negli esperimenti sono i.i.d.). Si può dimostrare che le seguenti variabili aleatorie: sono delle distribuzioni T di student ad n-2 gradi di libertà. 26
27
Intervalli di fiducia Intervalli di fiducia per: Coefficienti di regressione lineare Procedura: Si sceglie un livello di fiducia Calcolare il valore c tale che: Dove F è la distribuzione T di student ad n-2 gradi di libertà. Calcolare Gli intervalli di fiducia saranno: 27
28
Intervalli di fiducia Intervalli di fiducia per: Coefficienti di regressione lineare La quantità: Si chiama errore standard della pendenza e misura la precisione con cui 1 è stata stimata. In modo analogo, la quantità: Si chiama errore standard dell’intercetta e misura la precisione con cui 0 è stata stimata. 28
29
Intervalli di fiducia Intervalli di fiducia per: Previsioni modello lineare Un ulteriore esempio è la determinazione dell’intervallo di fiducia per la risposta media E(y=b 0 +b 1 x) per un particolare valore della variabile regressore x La stima puntuale fornisce un valore: Ci si pone il problema della determinazione di un intervallo di fiducia per la variabile y 0 in corrispondenza del valore x 0 Ipotesi: Gli errori i sono indipendenti e normalmente distribuiti. La varianza degli errori è uguale a 2 29
30
Intervalli di fiducia Intervalli di fiducia per: Previsioni modello lineare Il primo passaggio consiste nella determinazione della varianza della variabile aleatoria La varianza è: Se per 2 prendiamo lo stimatore MSE si può dimostrare che la variabile aleatoria: È una distribuzione T di student ad n-2 g.d.l. 30 Si può dimostrare che le VA e b 1 sono indipendenti
31
Intervalli di fiducia Intervalli di fiducia per: Previsioni modello lineare Procedura: Scegliere un livello di fiducia Calcolare il valore c tale che: Dove F è la distribuzione T di student ad n-2 gradi di libertà. Calcolare L’intervallo di fiducia sarà: 31
32
Intervalli di fiducia Intervalli di fiducia per: Previsioni modello lineare L’intervallo di fiducia è variabile con x, esso assumerà valore minimo in corrispondenza del centroide dei dati. 32
33
Intervalli di fiducia Intervalli di fiducia per: Coefficienti di regressione multilineare Problema: Regressione multilineare: Ipotesi: Gli errori i sono indipendenti e normalmente distribuiti. La varianza degli errori è uguale a 2 Ne segue che la stima a è normalmente distribuita con vettore media e matrice di covarianza 2 (F T F) -1 Questo implica che la marginale di ogni coefficiente di regressione è normale con media j e varianza 2 C jj, l’elemento diagonale della matrice (F T F) -1 33
34
Intervalli di fiducia Intervalli di fiducia per: Coefficienti di regressione multilineare Ne consegue che la generica statistica: È una distribuzione t di student ad n-p gradi di libertà, dove MSE è la stima di 2, così come definito nel semplice caso della regressione lineare. 34
35
Intervalli di fiducia Intervalli di fiducia per: Coefficienti di regressione multilineare Procedura: Scegliere un livello di fiducia Calcolare il valore c tale che: Dove F è la distribuzione t di student ad n-p gradi di libertà. Calcolare L’intervallo di fiducia sarà: 35
36
Intervalli di fiducia Intervalli di fiducia Riepilogo Intervallo di valori in cui è molto probabile (ma non certo!) che cada il valore vero del parametro che si intende stimare. Stimatore deve essere di tipo Gaussiano: Varianza stimatore notaSi ricorre alla Gaussiana Standard Varianza stimatore ignota Soluzione: Stima della varianza dell’errore sperimentale Varianza errore sperimentale 2 nota Varianza errore sperimentale 2 ignota Stima della varianza dello stimatore Si ricorre alla T di student Errori sperimentali di tipo Gaussiano e di varianza 2
37
Intervalli di fiducia Regioni congiunte di fiducia per i coefficienti di regressione È possibile anche determinare la regione nello spazio dei parametri in cui la probabilità che tutte le condizioni per i coefficienti di regressione siano soddisfatte contemporaneamente. È possibile determinare una regione congiunta di fiducia per tutti i parametri
38
Intervalli di fiducia Regioni congiunte di fiducia per i coefficienti di regressione Si può dimostrare che, in presenza di una regressione multilineare a p parametri, la variabile aleatoria: è una variabile aleatoria che una distribuzione di tipo F di Fisher a (p,n-p) gradi di libertà.
39
Intervalli di fiducia Regioni congiunte di fiducia per i coefficienti di regressione Procedura: Scegliere un livello di fiducia g Calcolare il valore c tale che: Dove F è la distribuzione F di Fisher ad n-p gradi di libertà. La regione nello spazio dei parametri definita dalla diseguaglianza: è la regione congiunta di fiducia per i coefficienti della regressione
40
Intervalli di fiducia Regioni congiunte di fiducia per i coefficienti di regressione La diseguaglianza descrive una regione di forma elissoidale. In figura è rappresentato un esempio per p=2
41
Intervalli di fiducia Regioni congiunte di fiducia per i coefficienti di regressione La regione congiunta di fiducia non coincide con gli intervalli di fiducia: Il punto A appartiene ai singoli intervalli di fiducia, ma non appartiene alla regione congiunta
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.