La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

8) GLI INTERVALLI DI CONFIDENZA. Nelle precedenti pagine si è mostrato come uno stimatore per la ignota media di una generica v.c. X sia la v.c. Media.

Presentazioni simili


Presentazione sul tema: "8) GLI INTERVALLI DI CONFIDENZA. Nelle precedenti pagine si è mostrato come uno stimatore per la ignota media di una generica v.c. X sia la v.c. Media."— Transcript della presentazione:

1 8) GLI INTERVALLI DI CONFIDENZA

2 Nelle precedenti pagine si è mostrato come uno stimatore per la ignota media di una generica v.c. X sia la v.c. Media campionaria per la quale risulta e dove 2 è la varianza della suddetta v.c. X. E il verificarsi delle (1) ha portato a dire che X n è stimatore corretto e consistente per, essendo chiaro che tali proprietà si riflettono anche sulle singole determinazioni x di X n. In altri termini, ottenuta con n prove indipendenti in X la n-upla (x 1,…,x n ), la relativa media (1) è stima corretta e consistente di 8.1) Gli intervalli di confidenza

3 A tali informazioni se ne può ora aggiungere unaltra di notevole interesse ricorrendo alla celebre disuguaglianza di Biènaymé- Chebychev secondo cui, se Y è una generica v.c. con media Y e varianza 2 Y, vale la seguente disuguaglianza: dove k è una conveniente costante positiva arbitraria Sostanzialmente la disuguaglianza informa che è non minore di 1-1/k 2 la probabilità che effettuando una prova in Y si ottenga una determinazione y appartenente allintervallo ( Y - k Y, Y + k Y ). Una semplice verifica della disuguaglianza in questione è fornita dal seguente esempio. (2)

4 Esempio Sia Y la v.c. così articolata: y Y (y) 1/5 1/5 1/5 1/5 1/5 per la quale risulta: Scelto k = 1.5, lintervallo ( Y - k Y, Y + k Y ) risulta [7-(1.5)(4), 7+(1.5)(4)] ovvero (1, 13) e deve essere E in effetti la probabilità che la v.c. Y assuma un valore del suddetto intervallo è uguale alla somma delle probabilità:

5 e risulta 0,6 > 0.555, in accordo con quanto previsto dalla disuguaglianza più sopra proposta. Si supponga ora che X sia una v.c. con media ignota e in una prima fase con varianza 2 nota. Effettuate n prove indipendenti in X ed ottenuta la n-upla campionaria (x 1,…,x n ), sia x la stima corretta e consistente di. Impiegando ora la disuguaglianza di Biènaymé-Chebychev, avendo fissato un conveniente k > 0, si può scrivere: relazione che avverte che è non minore di 1-1/k 2 la probabilità che la v.c. X. Media campionaria X n assuma una determinazione appartenente allintervallo

6 Effettuate n prove indipendenti nella v.c. X con media ignota, è non minore di 1-1/k 2 la probabilità di ottenere una n-upla (x 1,…,x n ) la cui media soddisfi alla doppia disuguaglianza: Sottraendo membro a membro si ottiene (4) La (4) rappresenta lintervallo di confidenza La probabilità che la v.c. X n relativa ad n prove in X fornisca un intervallo di confidenza che contiene è non minore di 1-1/k 2 Esempio Sia X una v.c. con media ignota e varianza 2 =16. Si effettuano n=64 prove le cui determinazioni x i portano alla media:

7 rappresenta una determinazione della per la quale si ha: e Fissato k=2, in base alla (3) si ottiene: ossia: Avendo ottenuto quale determinazione di il valore 8 si può costruire lintervallo di confidenza, a livello non minore di 0.75, attraverso i passaggi seguenti: v.c. Media campionaria

8 Per semplicità, sino ad ora si è supposto di conoscere la varianza 2 di X, ma con opportuna procedura tale limitazione può farsi cadere impiegando in luogo della ignota 2 la sua stima corretta: Che con la (4) assume laspetto: Se la costruzione di intervalli di confidenza per la media e la varianza riguarda il caso in cui la v.c. X è di tipo Normale, si ottengono intervalli di confidenza migliori di quanto non consenta limpiego della disuguaglianza di Bìenaymè- Chebychev. Migliori nel senso che a parità di ampiezza hanno associata una probabilità più alta. (5)

9 Se la v.c. X è Normale lo è anche la v.c. Media campionaria Nellipotesi che lintervallo di confidenza riguardi lignota media di X - essendo nota invece la sua varianza 2 - lintervallo medesimo a livello esattamente (1 - ) ha la forma (6) Si ha infatti: doveè la soluzione dellequazione: essendo Z la v.c. Normale standardizzata. Nel caso precedente, fissato (1 - ) = 0.75, si ottiene, dalla Tavola della v.c. Z, z = 1.15 e lintervallo dato dalla (6) risulta: (meno ampio del precedente) 8.2) Media campionaria 1

10 Se anche la varianza 2 è ignota e viene pertanto stimata con lintervallo dato dalla (6) assume la forma: dove è la soluzione dellequazione: Essendo T la v.c. di Student. 2

11 8.3) Teorema del limite centrale e intervalli di confidenza Si è visto che la v.c. MEDIA CAMPIONARIA ha ed è stimatore corretto e consistente di di una generica v.c. X. Ma se lampiezza campionaria diverge ( ) Perciò: diventa degenere (varianza zero) con funzione di ripartizione:

12 Per il teorema del limite centrale, cioè si approssima alla normale standardizzata, e: Comunque sia fatta la f.r. di per n punti Perciò, con n elevato, qualunque sia la v.c. X di partenza, la media campionaria è: e si può costruire lintervallo di confidenza sulla distribuzione della normale.

13 8.4) Intervallo di confidenza asintotico per una percentuale o una frequenza relativa o una proporzione Sia X Ber (p) sappiamo che E(X) = p V(X) = p(1-p) Lo stimatore di p è =. Dalle proprietà degli operatori E e V, sappiamo che: E= = Per il terorema del limite centrale N (p, ) Oppure N( 0, 1)

14 A questo punto è possibile costruire un Intervallo di confidenza asintotico (n grande) per p Con - e tali che: P(- < Z< ) = 1- Tuttavia in questo modo gli estremi dellintervallo: non sono calcolabili perché p è ignoto. Se lo conoscessimo non saremmo più in ambito di inferenza statistica: p è loggetto dellinferenza da una variabile X i Bernoulliana. Allora si sostituisce al posto di p la sua stima cioè, restituendo lintervallo: a livello di confidenza 1-.

15 Esempio: Su 200 ragazzi 48 di essi affermano di non leggere un libro da più di un anno. Si costruisca un Intervallo di confidenza per la proporzione di ragazzi italiani che non legge un libro da più di un anno. Soluzione. Loggetto del problema è conoscere p cioè la proporzione di italiani che non legge un libro da più di un anno; a tal fine si estrae un campione di 150 ragazzi. E ragionevole che la stima della proporzione di ragazzi che non legge un libro da più di un anno (p) nella popolazione (Italia) venga stimata con la proporzione di ragazzi italiani che non legge un libro da più di un anno nel campione. La stima di p è allora 0,24. Il campione è abbastanza grande (n=200) per costruire lI.C. asintotico:

16 Lunica incognita in è che troviamo sulle tavole. Lintervallo di confidenza a livello 0,95 è: [0,24 – 1,96 ; 0,24 + 1,96 ] = [0,1808 ; 0,299]. Si noti che stimo una percentuale per cui anche gli estremi lo sono, cioè sono numeri tra 0 e 1. Interpretazione. Il valore di p non lo conosco, non lo saprò mai, tuttavia possiamo dire che ho una confidenza elevata che p sia compreso nellintervallo[0,1808 ; 0,299] perché

17 significa che su infiniti intervalli di confidenza, immaginando di estrarre infiniti campioni, il 95% di essi contiene p, ma non sappiamo con certezza se il nostro intervallo contiene p, ne abbiamo solo una confidenza elevata.


Scaricare ppt "8) GLI INTERVALLI DI CONFIDENZA. Nelle precedenti pagine si è mostrato come uno stimatore per la ignota media di una generica v.c. X sia la v.c. Media."

Presentazioni simili


Annunci Google