Intervalli di Fiducia Introduzione Intervalli di fiducia per la media – Caso varianza nota Intervalli di fiducia per la media – Caso varianza non nota.

Slides:



Advertisements
Presentazioni simili
Proprietà degli stimatori
Advertisements

redditività var. continua classi di redditività ( < 0 ; >= 0)
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
La covarianza.
LA MISURA IN PSICOLOGIA. Scopo del corso Il corso si propone di offrire allo studente:  un’introduzione alle tematiche connesse alla misura in psicologia.
Introduzione all’uso degli indicatori di valutazione ed ai metodi di valutazione Dott.ssa Gabriella Giuliano Direttore Sanitario CREAS-IFC-CNR giugno.
Statistica descrittiva: le variabili Frequenze: tabelle e grafici Indici di posizione, di dispersione e di forma Media e varianza di dati raggruppati Correlazione.
Indici di Posizione Giulio Vidotto Raffaele Cioffi.
Genetica delle Popolazioni a.a prof S. Presciuttini DIMENSIONE EFFETTIVA DELLA POPOLAZIONE Questo documento è pubblicato sotto licenza Creative.
Precorso di Statistica per le Lauree Magistrali
Distribuzioni limite La distribuzione normale
Introduzione a Statistica e Probabilità
Dip. Economia Politica e Statistica
Precorso di Statistica per le Lauree Magistrali
Variabili casuali a più dimensioni
Qualità dei dati Fabio Murena.
GLI STRUMENTI AUSILIARI
Tre diversi materiali:
Algoritmi di stima con perdita di pacchetti in reti di sensori wireless: modellizzazione a catene di Markov, stima e stima distribuita Chiara Brighenti,
Misure Meccaniche e Termiche - Università di Cassino
Metodi Quantitativi per Economia, Finanza e Management Lezione n°12 Regressione Logistica: Le ipotesi del modello, la stima del modello.
Le primitive di una funzione
Confronto fra 2 popolazioni
PROPORZIONALITÀ.
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Il concetto di derivata
Intervalli di numeri reali
Il concetto di derivata
PIANIFICAZIONE DEI TRASPORTI Regressione lineare
ELEMENTI DI DINAMICA DELLE STRUTTURE
Analisi delle Traiettorie: Modelli di Crescita Latente (LGM)
x : variabile indipendente
Precorso di Statistica per le Lauree Magistrali
Dip. Economia Politica e Statistica
Insiemi di punti: altre caratteristiche
Lo studio completo di una funzione
Elementi di teoria delle probabilità
APPUNTI DI STATISTICA INFERENZIALE
Alcuni modelli probabilistici
Introduzione a Statistica e Probabilità
Precorso di Statistica per le Lauree Magistrali
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Un esempio Una casa farmaceutica dichiara che un nuovo antidolorifico che sta per immettere sul mercato fa effetto mediamente in un tempo pari a 12,75.
Statistica Scienza che studia i fenomeni collettivi.
I numeri relativi DEFINIZIONE. Si dicono numeri relativi tutti i numeri interi, razionali e irrazionali dotati di segno (positivo o negativo). ESEMPI Numeri.
Università degli Studi di Modena e Reggio Emilia
La distribuzione campionaria: principi generali
Intervalli di confidenza
PROCEDURA per la misura e la relativa stima
LA RETTA.
Le primitive di una funzione
Interpretare la grandezza di σ
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9 Regressione lineare multipla: le ipotesi del modello, la stima del modello.
ANALISI DI REGRESSIONE
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9 Regressione lineare multipla: le ipotesi del modello, la stima del modello.
Esercizio La popolazione di adulti presenta una media di ansia pari a 4. Ad un campione di 35 soggetti con disturbo ossessivo compulsivo è stato somministrato.
Dip. Economia Politica e Statistica
Precorso di Statistica per le Lauree Magistrali
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9
Associazione tra due variabili
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Corso di Analisi Statistica per le Imprese
Precorso di Statistica per le Lauree Magistrali
Test per campioni indipendenti
Corso di Analisi Statistica per le Imprese
Dip. Economia Politica e Statistica
Variabile interveniente
I sistemi di equazioni di 1° grado
Transcript della presentazione:

Intervalli di Fiducia Introduzione Intervalli di fiducia per la media – Caso varianza nota Intervalli di fiducia per la media – Caso varianza non nota Intervalli di fiducia: coefficienti di regressione lineare Intervalli di fiducia: previsioni modello lineare Intervalli di fiducia: coefficienti di regressione multilineare Regioni congiunte di fiducia per i coefficienti di regressione 1

Intervalli di fiducia Intervalli di fiducia - Media aritmetica

Intervalli di fiducia Intervalli di Fiducia Introduzione Determinare l’intervallo di fiducia di una grandezza misurata , equivale alla determinazione di due numeri   e  , tali che includano il valore vero con “certezza”. Si è visto comunque che non è possibile, da un campione finito di dati sperimentali, trarre delle conclusioni riguardo alla popolazione che siano sicure al 100 % E’ possibile stabilire però un intervallo in cui il valore vero ha probabilità molto elevata (esempio: 95% o 99%) di cadere. 3

Intervalli di fiducia Intervalli di Fiducia Procedura Si sceglie una probabilità  vicina a 1. Tale probabilità prende il nome di livello di fiducia. Si determinano quindi due quantità   e   tali che la probabilità che   e   racchiudano il valore esatto  sia eguale a . L’intervallo di estremi   e   si chiama intervallo di fiducia e si indica con il simbolo: 4

Intervalli di fiducia Intervalli di Fiducia Procedura Scegliere  = 95% equivale a dire che, in presenza di un dato campione di dati, c’è una probabilità del 95% che il valore vero ricada nell’intervallo determinato. La scelta di  implica una differente ampiezza dell’intervallo di fiducia calcolato. All’aumentare di , quale è il comportamento della “larghezza” dell’intervallo di fiducia? 5

Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Caso varianza nota Sia dato un certo campione di dati sperimentali Ipotesi: – Tutte le grandezze misurate sono caratterizzate dalla stessa variabile aleatoria (eguale media e varianza) e sono indipendenti. – La varianza della variabile aleatoria è nota (per esempio da pregresse misure) – La media, invece, è ignota. 6

Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota La determinazione dell’intervallo di fiducia passa per i seguenti punti: 1.Scegliere un livello di fiducia  2.Calcolare il valore c tale che: 3.Calcolare 1.L’intervallo di fiducia per la popolazione sarà: 7 dove F è la distribuzione cumulativa della normale di tipo standard, ovvero X ~ N(0,1)

Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota Gli n campioni dei dati sperimentali possono essere visti come n singole osservazioni della stessa variabile aleatoria Y (con eguale distribuzione, eguale varianza, eguale media). La variabile media del campione è quindi una variabile aleatoria di media  e varianza  2 /n. La variabile aleatoria È una variabile aleatoria normale di tipo standard. 8

Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota 9

Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota 10 Questo passaggio merita un po’ di attenzione! (riflettere sulle VA in gioco)

Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota Importante: Nella diseguaglianza  è sempre costante. È l’intervallo di fiducia che varia con il campione. Per chiarire il concetto, si consideri il caso (poco realistico) in cui si abbia la conoscenza della popolazione in termini di media e varianza. La popolazione sia, per esempio, di tipo Gaussiano con media e varianza: Si prelevi da questa popolazione un campione di 10 elementi per cui la variabile aleatoria media sia:

Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota Se uno statistico ripete il calcolo dell’intervallo di fiducia più volte (ovviamente su campioni differenti): … Intervalli di fiducia calcolati Solo una volta su 20 l’intervallo di fiducia non racchiude il valore vero

Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota L’intervallo di fiducia rappresenta un intervallo di numeri reali in cui ricada il valore vero della media (), con una probabilità pari al 95%. Nel caso in cui l’intervallo di fiducia sia del 99%, l’intervallo è più grande o più piccolo di quello determinato precedentemente? Quale sarebbe l’intervallo di confidenza per un livello  del 100%? 13

Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota All’aumentare del numero di prove, la varianza della media aritmetica (ovvero l’incertezza nella stima) decresce L’intervallo di valori in cui sono più ricorrenti le stime per la media aritmetica si restringe:  c 1  c 1  c 2  c 2

Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza a priori nota Come valutare lo spessore c dell’intervallo di fiducia La costante c  può essere valutata dalla seguente probabilità: Essendo X la variabile aleatoria Gaussiana standard (di media 0 e varianza 1)  cc Valori tipici di c  per differenti livelli di fiducia   =0.95  =0.99

Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza non nota Il calcolo dell’intervallo di fiducia emerge in maniera naturale dalla natura Gaussiana dello stimatore media aritmetica Tale derivazione è possibile grazie alla conoscenza pregressa della varianza dell’errore sperimentale Nella realtà, questo è raramente possibile e si conosce solo una stima della varianza dell’errore sperimentale: Tale eventualità implica un’ulteriore sorgente di incertezza da tenere in conto nel calcolo dell’intervallo di fiducia In maniera intuitiva, dovremmo considerare degli intervalli più ampi di quelli registrati nel caso di conoscenza della varianza

Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza non nota 17

Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza non nota La variabile aleatoria: È una variabile normale di tipo standard Si è gia visto che lo stimatore imparziale varianza s 2 può essere correlata ad una variabile aleatoria  2 a n-1 gradi di libertà : 18

Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza non nota In conclusione la variabile aleatoria: È una variabile aleatoria di tipo T di student ad n -1 gradi di libertà Il passaggio alla T di student è necessario per la semplificazione della varianza   ignota. 19

Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza non nota Campione di risultati sperimentali come esito di una variabile aleatoria di tipo T di student (una volta nota la media dei dati sperimentali e la varianza stimata). È possibile quindi determinare quale è la probabilità che tale variabile assumi valori compresi in un certo intervallo. 20

Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza non nota È necessario quindi determinare, data la simmetria della distribuzione, un numero c tale che Data la simmetria della distribuzione, F(-c) = 1-F(c) e quindi Da cui 21

Intervalli di fiducia Intervalli di fiducia Media Aritmetica. Varianza non nota Proprietà distribuzione T di student: La distribuzione T di student è generalmente più larga della distribuzione normale di tipo standard. Pertanto ci attendiamo un intervallo di ampiezza più grande, rispetto al caso in cui la varianza sia nota in modo esatto. 22 r

Intervalli di fiducia Intervalli di fiducia per stimatori statistici generici. 23

Intervalli di fiducia Intervalli di fiducia per: Coefficienti di regressione lineare Oltre alle stime puntuali sui coefficienti di regressione è possibile valutare un intervallo di fiducia per i coefficienti stimati della regressione. Lo “spessore” dell’intervallo di fiducia è una misura della qualità della regressione. 24

Intervalli di fiducia Intervalli di fiducia per: Coefficienti di regressione lineare Nel caso della regressione lineare, è necessaria una stima imparziale della varianza dell’errore sperimentale: In parecchi libri di testo tale espressione prende anche il nome di Errore Quadratico Medio (in inglese: Mean Square Errore, acronimo MSE) 25

Intervalli di fiducia Intervalli di fiducia per: Coefficienti di regressione lineare Si è gia visto che gli stimatori b 0 e b 1 sono variabili aleatorie Gaussiane (se gli errori sperimentali negli esperimenti sono i.i.d.). Si può dimostrare che le seguenti variabili aleatorie: sono delle distribuzioni T di student ad n-2 gradi di libertà. 26

Intervalli di fiducia Intervalli di fiducia per: Coefficienti di regressione lineare Procedura: Si sceglie un livello di fiducia  Calcolare il valore c tale che: Dove F è la distribuzione T di student ad n-2 gradi di libertà. Calcolare Gli intervalli di fiducia saranno: 27

Intervalli di fiducia Intervalli di fiducia per: Coefficienti di regressione lineare La quantità: Si chiama errore standard della pendenza e misura la precisione con cui  1 è stata stimata. In modo analogo, la quantità: Si chiama errore standard dell’intercetta e misura la precisione con cui  0 è stata stimata. 28

Intervalli di fiducia Intervalli di fiducia per: Previsioni modello lineare Un ulteriore esempio è la determinazione dell’intervallo di fiducia per la risposta media E(y=b 0 +b 1 x) per un particolare valore della variabile regressore x La stima puntuale fornisce un valore: Ci si pone il problema della determinazione di un intervallo di fiducia per la variabile y 0 in corrispondenza del valore x 0 Ipotesi: Gli errori  i sono indipendenti e normalmente distribuiti. La varianza degli errori è uguale a  2 29

Intervalli di fiducia Intervalli di fiducia per: Previsioni modello lineare Il primo passaggio consiste nella determinazione della varianza della variabile aleatoria La varianza è: Se per  2 prendiamo lo stimatore MSE si può dimostrare che la variabile aleatoria: È una distribuzione T di student ad n-2 g.d.l. 30 Si può dimostrare che le VA e b 1 sono indipendenti

Intervalli di fiducia Intervalli di fiducia per: Previsioni modello lineare Procedura: Scegliere un livello di fiducia  Calcolare il valore c tale che: Dove F è la distribuzione T di student ad n-2 gradi di libertà. Calcolare L’intervallo di fiducia sarà: 31

Intervalli di fiducia Intervalli di fiducia per: Previsioni modello lineare L’intervallo di fiducia è variabile con x, esso assumerà valore minimo in corrispondenza del centroide dei dati. 32

Intervalli di fiducia Intervalli di fiducia per: Coefficienti di regressione multilineare Problema: Regressione multilineare: Ipotesi: Gli errori  i sono indipendenti e normalmente distribuiti. La varianza degli errori è uguale a  2 Ne segue che la stima a è normalmente distribuita con vettore media e matrice di covarianza  2 (F T F) -1 Questo implica che la marginale di ogni coefficiente di regressione è normale con media  j e varianza  2 C jj, l’elemento diagonale della matrice (F T F) -1 33

Intervalli di fiducia Intervalli di fiducia per: Coefficienti di regressione multilineare Ne consegue che la generica statistica: È una distribuzione t di student ad n-p gradi di libertà, dove MSE è la stima di  2, così come definito nel semplice caso della regressione lineare. 34

Intervalli di fiducia Intervalli di fiducia per: Coefficienti di regressione multilineare Procedura: Scegliere un livello di fiducia  Calcolare il valore c tale che: Dove F è la distribuzione t di student ad n-p gradi di libertà. Calcolare L’intervallo di fiducia sarà: 35

Intervalli di fiducia Intervalli di fiducia Riepilogo Intervallo di valori in cui è molto probabile (ma non certo!) che cada il valore vero del parametro  che si intende stimare. Stimatore deve essere di tipo Gaussiano: Varianza stimatore notaSi ricorre alla Gaussiana Standard Varianza stimatore ignota Soluzione: Stima della varianza dell’errore sperimentale Varianza errore sperimentale  2 nota Varianza errore sperimentale  2 ignota Stima della varianza dello stimatore Si ricorre alla T di student Errori sperimentali di tipo Gaussiano e di varianza  2

Intervalli di fiducia Regioni congiunte di fiducia per i coefficienti di regressione È possibile anche determinare la regione nello spazio dei parametri in cui la probabilità che tutte le condizioni per i coefficienti di regressione siano soddisfatte contemporaneamente. È possibile determinare una regione congiunta di fiducia per tutti i parametri 

Intervalli di fiducia Regioni congiunte di fiducia per i coefficienti di regressione Si può dimostrare che, in presenza di una regressione multilineare a p parametri, la variabile aleatoria: è una variabile aleatoria che una distribuzione di tipo F di Fisher a (p,n-p) gradi di libertà.

Intervalli di fiducia Regioni congiunte di fiducia per i coefficienti di regressione Procedura: Scegliere un livello di fiducia g Calcolare il valore c tale che: Dove F è la distribuzione F di Fisher ad n-p gradi di libertà. La regione nello spazio dei parametri definita dalla diseguaglianza: è la regione congiunta di fiducia per i coefficienti della regressione

Intervalli di fiducia Regioni congiunte di fiducia per i coefficienti di regressione La diseguaglianza descrive una regione di forma elissoidale. In figura è rappresentato un esempio per p=2

Intervalli di fiducia Regioni congiunte di fiducia per i coefficienti di regressione La regione congiunta di fiducia non coincide con gli intervalli di fiducia: Il punto A appartiene ai singoli intervalli di fiducia, ma non appartiene alla regione congiunta