Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica – Facoltà di Economia - UniCal
Intervalli di ConfidenzaF. Domma2 I metodi di stima puntuali anche se corredati di tutte le proprietà giudicate desiderabili e ottimali, difficilmente potranno fornire delle stime che coincidono con il parametro incognito, poiché ci si dovrà sempre attendere un certo errore di campionamento. Nasce, quindi, l’esigenza di associare allo stimatore una misure dell’errore di stima commesso, in modo tale da valutare quanto la stima sia da considerarsi “vicina” al parametro incognito. Tali valutazioni possono essere fatte facendo riferimento alla dispersione della distribuzione campionaria dello stimatore T(X). In relazione alla stima t(x), ottenuta tramite il campione osservato, e alla precisione dello stimatore, ci saranno dei valori di che sulla base del campione debbono essere considerati più plausibili di altri. Definito, quindi, il grado di plausibilità si potrà dividere lo spazio parametrico in due sottoinsiemi:
Intervalli di ConfidenzaF. Domma3 uno di valori probabili per secondo il grado di plausibilità fissato ed un altro di valori poco probabili per . Così, invece di stimare un unico valore per , si stimerà un insieme di valori possibili a cui verrà associato il grado di plausibilità scelto il quale deve essere interpretato come livello di confidenza per l’insieme.
Intervalli di ConfidenzaF. Domma4 Sia X un c.c. estratto da f(x; ) appartenente alla famiglia di distribuzioni P. Diamo la seguente Definizione. La famiglia di intervalli S(X) di , funzione di X ma non di , è chiamato intervallo casuale. S(X) è del tipo dove e sono, rispettivamente, il limite inferiore e superiore dell’intervallo casuale.
Intervalli di ConfidenzaF. Domma5 Definizione. Per un dato valore di (usualmente piccolo), 0< <1, un intervallo di confidenza al 100(1- )% per è la realizzazione di un intervallo casuale tale che La quantità in genere è uguale ad 1- , è chiamato coefficiente fiduciario dell’intervallo casuale.
Intervalli di ConfidenzaF. Domma6 Un metodo generale per la costruzione di intervalli di confidenza è costituito dalla ricerca di una funzione del campione e del parametro incognito da stimare che abbia una distribuzione indipendente da parametro stesso.
Intervalli di ConfidenzaF. Domma7 Metodo della Quantità Pivot Definizione. Quantità Pivot. P Sia X 1,…,X n un c.c. estratto da una fd (o fp) f(x; ) appartenente a P. Sia Q=q(X 1,…,X n ; ) una funzione del c.c. e del parametro incognito . Se la v.c. Q ha distribuzione indipendente da , allora Q è detta quantità pivot. Definizione. Quantità Pivot. P Sia X 1,…,X n un c.c. estratto da una fd (o fp) f(x; ) appartenente a P. Sia Q=q(X 1,…,X n ; ) una funzione del c.c. e del parametro incognito . Se la v.c. Q ha distribuzione indipendente da , allora Q è detta quantità pivot. Se Q=q(X; ) è una quantità pivot, allora per ogni fissato, 0< <1, esisteranno due valori q 1 e q 2 dipendenti da , tali che Per ogni c.o. x 1,…,x n, si ha: Ora, se da questa doppia diseguaglianza, riusciamo a calcolare la seguente:
Intervalli di ConfidenzaF. Domma8 Per funzioni t 1 e t 2 indipendenti da , allora (t 1,t 2 ) è un intervallo fiduciario (di confidenza) al 100(1- )% per . In tal modo costruiamo un I.C. per in due fasi: 1 a - individuare la q.p.; 2 a - invertire la doppia diseguaglianza in termini di . In tal modo costruiamo un I.C. per in due fasi: 1 a - individuare la q.p.; 2 a - invertire la doppia diseguaglianza in termini di .
Intervalli di ConfidenzaF. Domma9 Campionamento da popolazioni Normali Sia X un c.c. iid estratto da Costruire un I.C. per con il metodo della quantità pivot. Esistono due casi distinti: a) varianza nota; b) varianza sconosciuta. Esistono due casi distinti: a) varianza nota; b) varianza sconosciuta.
Intervalli di ConfidenzaF. Domma10 A) Varianza nota 1) Individuazione della Quantità Pivot. Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito ( ) con fd (o fp) indipendente dal parametro incognito. 1) Individuazione della Quantità Pivot. Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito ( ) con fd (o fp) indipendente dal parametro incognito. Sia X un c.c. iid estratto da N(.;.). Sappiamo che, in tale contesto, la media campionaria ha la seguente distribuzione E’ evidente che la media campionaria non è una quantità pivot.
Intervalli di ConfidenzaF. Domma11 Consideriamo la standardizzazione della media campionaria, cioè: Z è una quantità pivot per ; infatti, si ha: 1) è funzione del c.c. X e del parametro incognito , cioè 2) Z ha distribuzione indipendente dal parametro incognito . Fissato , con 0< <1, possiamo trovare due valori, q 1 e q 2, tali che
Intervalli di ConfidenzaF. Domma12 2) Inversione della doppia diseguaglianza in termini di ;
Intervalli di ConfidenzaF. Domma13 La determinazione di q 1 e q 2 dipende da e dalla fd (o fp) della q.p. Generalmente, viene fissato ad un valore molto basso 0.01, Ripartiamo in parti uguali, sulle code della normale standardizzata, in modo tale che Generalmente, viene fissato ad un valore molto basso 0.01, Ripartiamo in parti uguali, sulle code della normale standardizzata, in modo tale che
Intervalli di ConfidenzaF. Domma14 Sostituendo si ha: Gli estremi dell’intervallo casuale (T 1,T 2 ), sono: Osservato il c.c. x=(x 1,…,x n ), l’Intervallo di confidenza al 100(1- )% per è:
Intervalli di ConfidenzaF. Domma15 Esempio. Il termine fiduciario nasce dalla seguente osservazione: se estraessimo dalla popolazione ripetutamente campioni di dimensione n e se calcolassimo per ognuno di questi l’intervallo (t 1,t 2 ), la frequenza relativa di intervalli che contengono tenderebbe al 100(1- )%. Abbiamo, quindi, una considerevole fiducia che l’intervallo osservato contenga . La misura della nostra fiducia è 100(1- )%.
Intervalli di ConfidenzaF. Domma16 B) Varianza sconosciuta 1) Individuazione della Quantità Pivot. Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito ( ) con fd (o fp) indipendente dal parametro incognito. 1) Individuazione della Quantità Pivot. Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito ( ) con fd (o fp) indipendente dal parametro incognito. Dire perché la quantità non è utile per costruire un I.C. per con sconosciuta.
Intervalli di ConfidenzaF. Domma17 Osservazione: Si dimostra, inoltre, che: Sappiamo che: In definitiva, la v.c. T ha distribuzione indipendente da parametri incogniti (dipende solo dai gradi di libertà n-1).
Intervalli di ConfidenzaF. Domma18 Si osservi, ora, che In definitiva, abbiamo Quest’ultima quantità è una q.p.; infatti, T è funzione di X e di , con f.d. indipendente da parametri incogniti. Individuata la q.p., fissato , possiamo trovare q 1 e q 2 tali che
Intervalli di ConfidenzaF. Domma19 2) Inversione della doppia diseguaglianza in termini di ;
Intervalli di ConfidenzaF. Domma20 Ripartiamo in parti uguali, sulle code della t di Student, in modo tale che La determinazione di q 1 e q 2 dipende da e dalla fd (o fp) della q.p.
Intervalli di ConfidenzaF. Domma21 Sostituendo si ha: Gli estremi dell’intervallo casuale (T 1,T 2 ), sono: Osservato il c.c. x=(x 1,…,x n ), l’Intervallo di confidenza al 100(1- )% per è:
Intervalli di ConfidenzaF. Domma22 Esempio.
Intervalli di ConfidenzaF. Domma23 Osservazione - 1 Dato l’intervallo La lunghezza ( L ) dell’intervallo di confidenza è definita come differenza tra gli estremi dell’intervallo stesso, cioè Si definisce errore la lunghezza dell’intervallo diviso 2, cioè
Intervalli di ConfidenzaF. Domma24 - a parità di : - L diminuisce al diminuire di ; - L diminuisce all’aumentare di n. - a parità di : - L diminuisce al diminuire di ; - L diminuisce all’aumentare di n. - a parità di n e : - L diminuisce all’aumentare di [in tal caso diminuisce il grado di fiducia (1- ) ] - a parità di n e : - L diminuisce all’aumentare di [in tal caso diminuisce il grado di fiducia (1- ) ] Situazione ottima: L piccolo - (1- ) elevato
Intervalli di ConfidenzaF. Domma25 Osservazione - 2 Fissato , a parità di e s e della dimensione campionaria n, gli intervalli di confidenza per la media della popolazione costruiti con T sono più ampi.
Intervalli di ConfidenzaF. Domma26 Osservazione - 3 In alcuni casi, è necessario calcolare la dimensione campionaria minima affinché l’I.C. abbia una lunghezza prefissata. Così,ad esempio, nel caso di I.C. per con noto, si ha:
Intervalli di ConfidenzaF. Domma27 Esempio
Intervalli di ConfidenzaF. Domma28 Campionamento da popolazioni Normali Sia X un c.c. iid estratto da Esistono due casi distinti: a) sconosciuta; b) nota. Esistono due casi distinti: a) sconosciuta; b) nota. Costruire un I.C. per 2 con il metodo della quantità pivot.
Intervalli di ConfidenzaF. Domma29 A) Media sconosciuta 1) Individuazione della Quantità Pivot. Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito ( ) con fd (o fp) indipendente dal parametro incognito. 1) Individuazione della Quantità Pivot. Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito ( ) con fd (o fp) indipendente dal parametro incognito. Si è visto in precedenza che la quantità E’ evidente che V è una funzione del c.c. X e del parametro incognito ; inoltre, si distribuisce secondo una chi-quadrato con (n-1) gradi di libertà ovvero la distribuzione non dipende da parametri incogniti. Da ciò si può concludere che V è una quantità pivot per
Intervalli di ConfidenzaF. Domma30 2) Inversione della doppia diseguaglianza in termini di ; Fissato , possiamo determinare q 1 e q 2 tali che
Intervalli di ConfidenzaF. Domma31 Ripartiamo in parti uguali, sulle code della Chi-quadrato, in modo tale che La determinazione di q 1 e q 2 dipende da e dalla fd (o fp) della q.p.
Intervalli di ConfidenzaF. Domma32 Gli estremi dell’intervallo casuale (T 1,T 2 ), sono: Osservato il c.c. x=(x 1,…,x n ), l’Intervallo di confidenza al 100(1- )% per è: Sostituendo si ha:
Intervalli di ConfidenzaF. Domma33 B) Media nota 1) Individuazione della Quantità Pivot. Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito ( ) con fd (o fp) indipendente dal parametro incognito. 1) Individuazione della Quantità Pivot. Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito ( ) con fd (o fp) indipendente dal parametro incognito. E’ evidente che V è una funzione del c.c. X e del parametro incognito ; inoltre, si distribuisce secondo una chi-quadrato con (n) gradi di libertà ovvero la distribuzione non dipende da parametri incogniti. Da ciò si può concludere che V è una quantità pivot per
Intervalli di ConfidenzaF. Domma34 Utilizzando lo stesso procedimento del caso (A), si ottiene l’I.C. per 2, cioè Gli estremi dell’intervallo casuale (T 1,T 2 ), sono: Osservato il c.c. x=(x 1,…,x n ), l’Intervallo di confidenza al 100(1- )% per è:
Intervalli di ConfidenzaF. Domma35 Esempio.
Intervalli di ConfidenzaF. Domma36 Intervallo di Confidenza per la differenza tra le medie di due popolazioni Normali. Intervallo di Confidenza per la differenza tra le medie di due popolazioni Normali. Siano X ed Y due v.c. indipendenti e normalmente distribuite, cioè
Intervalli di ConfidenzaF. Domma37 Vogliamo costruire un I.C. per la differenza tra le medie x e y. Primo Caso: e e Note Stimatore naturale della differenza tra le medie E’ semplice verificare che
Intervalli di ConfidenzaF. Domma38 La v.c. E’ una quantità pivot perché è funzione del c.c. (X,Y) e del parametro incognito ( x - y ) ed ha distribuzione indipendente da parametri incogniti. Fissato , possiamo determinare q 1 e q 2 tali che E’ una quantità pivot perché è funzione del c.c. (X,Y) e del parametro incognito ( x - y ) ed ha distribuzione indipendente da parametri incogniti. Fissato , possiamo determinare q 1 e q 2 tali che
Intervalli di ConfidenzaF. Domma39
Intervalli di ConfidenzaF. Domma40 Ricordando che
Intervalli di ConfidenzaF. Domma41 Si ottiene: Gli estremi dell’intervallo casuale (T 1,T 2 ), per la differenza tra le medie nel caso di varianze note, sono:
Intervalli di ConfidenzaF. Domma42 Osservati x=(x 1,…,x m ) e y=(y 1,…,y n ), l’I.C. per la differenza tra le medie ( x - y ), nel caso di varianze note, al 100(1- )% è: dove con e e
Intervalli di ConfidenzaF. Domma43 Se le varianza sono sconosciute, Z non è una quantità pivot per ( x - y ). Secondo Caso: varianze uguali ma sconosciute Stimatore naturale della differenza tra le medie Da quanto detto in precedenza, si evince che
Intervalli di ConfidenzaF. Domma44 Si osserva, inoltre, che Poiché V 1 e V 2 sono indipendenti, dalla proprietà riproduttiva della v.c. chi-quadrato, si ha:
Intervalli di ConfidenzaF. Domma45 Dato che le v.c. Z e V 1 +V 2 sono indipendenti, possiamo costruire la v.c. t-student, cioè Tale rapporto si può scrive nel seguente modo:
Intervalli di ConfidenzaF. Domma46 dove È lo stimatore non-distorto della varianza comune 2 ; infatti, si ha:
Intervalli di ConfidenzaF. Domma47 In definitiva, la v.c. È una quantità pivot perché funzione del c.c. (X,Y) e del parametro da stimare ( x - y ) con distribuzione che non dipende da parametri incogniti. Fissato , possiamo determinare q 1 e q 2 tali che È una quantità pivot perché funzione del c.c. (X,Y) e del parametro da stimare ( x - y ) con distribuzione che non dipende da parametri incogniti. Fissato , possiamo determinare q 1 e q 2 tali che
Intervalli di ConfidenzaF. Domma48
Intervalli di ConfidenzaF. Domma49 Ricordando che
Intervalli di ConfidenzaF. Domma50 Sostituendo, si ottiene: Gli estremi dell’intervallo casuale (T 1,T 2 ), per la differenza tra le medie nel caso di varianze incognite ma uguali, sono:
Intervalli di ConfidenzaF. Domma51 Osservati x=(x 1,…,x m ) e y=(y 1,…,y n ), l’I.C. per la differenza tra le medie ( x - y ), nel caso di varianze incognite ma uguali, al 100(1- )% è: dove con e e
Intervalli di ConfidenzaF. Domma52 Esempio
Intervalli di ConfidenzaF. Domma53 Intervallo di Confidenza sulla probabilità di successo Sia X una v.c. di Bernoulli con probabilità di successo pari a . Si ricorda che E(X)= e V(X)= (1- ). Dato un c.c. X 1,…,X n estratto da B( ,1), si vuole costruire un intervallo di Confidenza per al 100(1- )%. Consideriamo la proporzione di successi in n-prove indipendenti Sappiamo che
Intervalli di ConfidenzaF. Domma54 Dal teorema di De Moivre-Laplace, sappiamo che Si evidenzia che la v.c. Z pur essendo una q.p. (perché è funzione del c.c. e del parametro incognito ed ha distribuzione indipendente da parametri incogniti) NON può essere utilizzata per costruire un intervallo di confidenza asintotico per la probabilità di successo. Infatti, la varianza della popolazione è sconosciuta. E’ necessario quindi stimare la varianza della popolazione.
Intervalli di ConfidenzaF. Domma55 Consideriamo lo stimatore naturale della varianza della popolazione Perché essendo X i =0 oppure X i =1. Consideriamo, ora, la varianza campionaria non-distorta
Intervalli di ConfidenzaF. Domma56 Sostituiamo a V(X) lo stimatore non-distorto S 2 Si dimostra che Quest’ultima è una quantità pivot per la probabilità di successo .
Intervalli di ConfidenzaF. Domma57 Fissato , possiamo determinare q 1 e q 2 tali che
Intervalli di ConfidenzaF. Domma58 Analogamente, a quanto visto in precedenza possiamo dire che
Intervalli di ConfidenzaF. Domma59 Sostituendo abbiamo Gli estremi dell’intervallo casuale (T 1,T 2 ), per la probabilità di successo, sono:
Intervalli di ConfidenzaF. Domma60 Osservato x=(x 1,…,x m ), l’I.C. asintotico per la probabilità di successo al 100(1- )% è: dove
Intervalli di ConfidenzaF. Domma61 Esempio.
Intervalli di ConfidenzaF. Domma62
Intervalli di ConfidenzaF. Domma63
Intervalli di ConfidenzaF. Domma64
Intervalli di ConfidenzaF. Domma65
Intervalli di ConfidenzaF. Domma66