8) GLI INTERVALLI DI CONFIDENZA

Slides:



Advertisements
Presentazioni simili
6) LA STIMA Stima del valore dei parametri ignoti che caratterizzano la leggi delle v.c. assunte ad interpreti dei fenomeni oggetto d’attenzione. Verifica.
Advertisements

LIMITI:DEFINIZIONI E TEOREMI
Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
Intervalli di confidenza
Proprietà degli stimatori
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Confronto tra 2 campioni Nella pratica è utilissimo confrontare se 2 campioni provengono da popolazioni con la stessa media: Confronti tra produzioni di.
Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento.
Fondamenti della Misurazione
LIMITI DAGLI INTORNI ALL DAGLI INTORNI ALL. Compresa la definizione di limite, adesso cerchiamo di trovarne unaltra più efficace da un punto di vista.
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Analisi dei dati per i disegni ad un fattore
Progetto Pilota 2 Lettura e interpretazione dei risultati
STATISTICA A – K (60 ore) Marco Riani
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
Inferenza statistica per un singolo campione
Le Variabili Casuali Corso di Teoria dell’Inferenza Statistica 1
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
DALL'INTERVALLO DI PROBABILITÀ
Processi Aleatori : Introduzione – Parte I
Distribuzioni di probabilità
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 4: La funzione di Gauss
Corso di biomatematica Lezione 2: Probabilità e distribuzioni di probabilità Davide Grandi.
Corso di biomatematica lezione 7-2: Test di significatività
STATISTICA a.a PARAMETRO t DI STUDENT
Esercizi x1=m-ts x2=m+ts
Valutazione della stima: gli intervalli di confidenza
Concetti legati all’incertezza statistica
Lezione 8 Numerosità del campione
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 6 Inferenza statistica
Lezione 6 Inferenza statistica
PROBABILITÀ La probabilità è un giudizio che si assegna ad un evento e che si esprime mediante un numero compreso tra 0 e 1 1 Evento con molta probabilità.
METODI E CONTROLLI STATISTICI DI PROCESSO
Le distribuzioni campionarie
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Intervalli di fiducia.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Corso di Analisi Statistica per le Imprese
IL CAMPIONE.
“Teoria e metodi della ricerca sociale e organizzativa”
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Le distribuzioni campionarie
Test basati su due campioni Test Chi - quadro
Def : uno stimatore è una statistica T n le cui determinazioni servono a fornire delle stime del parametro ignoto  della v.c. X in cui sono state effettuate.
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
“Teoria e metodi della ricerca sociale e organizzativa”
Intervalli di confidenza
La distribuzione campionaria della media
Elaborazione statistica di dati
Esercitazioni di Statistica con Matlab Dott
La covarianza.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
Distribuzioni limite La distribuzione normale Si consideri una variabile casuale rappresentata mediante una combinazione lineare di altre variabili casuali.
Corso di Laurea Magistrale in Economia e Professioni
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Introduzione all’inferenza
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
L’INFERENZA STATISTICA
Transcript della presentazione:

8) GLI INTERVALLI DI CONFIDENZA

8.1) Gli intervalli di confidenza Nelle precedenti pagine si è mostrato come uno stimatore per la ignota media  di una generica v.c. X sia la v.c. Media campionaria per la quale risulta (1) e dove 2 è la varianza della suddetta v.c. X. E il verificarsi delle (1) ha portato a dire che Xn è stimatore corretto e consistente per , essendo chiaro che tali proprietà si riflettono anche sulle singole determinazioni x di Xn . In altri termini, ottenuta con n prove indipendenti in X la n-upla (x1 ,…,xn ), la relativa media è stima corretta e consistente di 

A tali informazioni se ne può ora aggiungere un’altra di notevole interesse ricorrendo alla celebre disuguaglianza di Biènaymé-Chebychev secondo cui, se Y è una generica v.c. con media Y e varianza 2Y, vale la seguente disuguaglianza: (2) dove k è una conveniente costante positiva arbitraria Sostanzialmente la disuguaglianza informa che è non minore di 1-1/k2 la probabilità che effettuando una prova in Y si ottenga una determinazione y appartenente all’intervallo (Y - k Y , Y + k Y). Una semplice verifica della disuguaglianza in questione è fornita dal seguente esempio.

Esempio Sia Y la v.c. così articolata: per la quale risulta: Scelto k = 1.5, l’intervallo (Y - k Y , Y + k Y) risulta [7-(1.5)(4) , 7+(1.5)(4)] ovvero (1 , 13) e deve essere E in effetti la probabilità che la v.c. Y assuma un valore del suddetto intervallo è uguale alla somma delle probabilità:

e risulta 0,6 > 0.555, in accordo con quanto previsto dalla disuguaglianza più sopra proposta. Si supponga ora che X sia una v.c. con media  ignota e in una prima fase con varianza 2 nota. Effettuate n prove indipendenti in X ed ottenuta la n-upla campionaria (x1 ,…,xn ), sia x la stima corretta e consistente di . Impiegando ora la disuguaglianza di Biènaymé-Chebychev, avendo fissato un conveniente k > 0, si può scrivere: relazione che avverte che è non minore di 1-1/k2 la probabilità che la v.c. X. Media campionaria Xn assuma una determinazione appartenente all’intervallo

Effettuate n prove indipendenti nella v. c Effettuate n prove indipendenti nella v.c. X con media  ignota, è non minore di 1-1/k2 la probabilità di ottenere una n-upla (x1 ,…,xn ) la cui media soddisfi alla doppia disuguaglianza: Sottraendo membro a membro si ottiene (4) La (4) rappresenta l’intervallo di confidenza La probabilità che la v.c. Xn relativa ad n prove in X fornisca un intervallo di confidenza che contiene  è non minore di 1-1/k2 Esempio Sia X una v.c. con media  ignota e varianza 2 =16. Si effettuano n=64 prove le cui determinazioni xi portano alla media:

rappresenta una determinazione della v.c. Media campionaria per la quale si ha: e Fissato k=2, in base alla (3) si ottiene: ossia: Avendo ottenuto quale determinazione di il valore 8 si può costruire l’intervallo di confidenza, a livello non minore di 0.75, attraverso i passaggi seguenti:

Per semplicità, sino ad ora si è supposto di conoscere la varianza 2 di X, ma con opportuna procedura tale limitazione può farsi cadere impiegando in luogo della ignota 2 la sua stima corretta: Che con la (4) assume l’aspetto: (5) Se la costruzione di intervalli di confidenza per la media e la varianza riguarda il caso in cui la v.c. X è di tipo Normale, si ottengono intervalli di confidenza migliori di quanto non consenta l’impiego della disuguaglianza di Bìenaymè-Chebychev. Migliori nel senso che a parità di ampiezza hanno associata una probabilità più alta.

8.2) Media campionaria Se la v.c. X è Normale lo è anche la v.c. Media campionaria Nell’ipotesi che l’intervallo di confidenza riguardi l’ignota media  di X - essendo nota invece la sua varianza 2 - l’intervallo medesimo a livello esattamente (1 - ) ha la forma 1 (6) Si ha infatti: dove è la soluzione dell’equazione: essendo Z la v.c. Normale standardizzata. Nel caso precedente, fissato (1 - ) = 0.75, si ottiene, dalla Tavola della v.c. Z, z0.125 = 1.15 e l’intervallo dato dalla (6) risulta: (meno ampio del precedente)

2 Se anche la varianza 2 è ignota e viene pertanto stimata con l’intervallo dato dalla (6) assume la forma: dove è la soluzione dell’equazione: Essendo T la v.c. di Student.

8.3) Teorema del limite centrale e intervalli di confidenza Si è visto che la v.c. MEDIA CAMPIONARIA ha ed è stimatore corretto e consistente di di una generica v.c. X. Ma se l’ampiezza campionaria diverge ( ) Perciò: diventa degenere (varianza zero) con funzione di ripartizione:

Comunque sia fatta la f.r. di per n punti Per il teorema del limite centrale, cioè si approssima alla normale standardizzata, e: Perciò, con n elevato, qualunque sia la v.c. X di partenza, la media campionaria è: e si può costruire l’intervallo di confidenza sulla distribuzione della normale.

8.4) Intervallo di confidenza asintotico per una percentuale o una frequenza relativa o una proporzione Sia X  Ber (p) sappiamo che E(X) = p V(X) = p(1-p)   Lo stimatore di p è =. Dalle proprietà degli operatori E e V, sappiamo che: E= = Per il terorema del limite centrale N (p, )   Oppure N( 0, 1)

A questo punto è possibile costruire un Intervallo di confidenza asintotico (n grande) per p   Con - e tali che: P(- < Z< ) = 1- Tuttavia in questo modo gli estremi dell’intervallo: non sono calcolabili perché p è ignoto. Se lo conoscessimo non saremmo più in ambito di inferenza statistica: p è l’oggetto dell’inferenza da una variabile Xi Bernoulliana. Allora si sostituisce al posto di p la sua stima cioè , restituendo l’intervallo: a livello di confidenza 1-.

Esempio: Su 200 ragazzi 48 di essi affermano di non leggere un libro da più di un anno. Si costruisca un Intervallo di confidenza per la proporzione di ragazzi italiani che non legge un libro da più di un anno.   Soluzione. L’oggetto del problema è conoscere p cioè la proporzione di italiani che non legge un libro da più di un anno; a tal fine si estrae un campione di 150 ragazzi. E’ ragionevole che la stima della proporzione di ragazzi che non legge un libro da più di un anno (p) nella popolazione (Italia) venga stimata con la proporzione di ragazzi italiani che non legge un libro da più di un anno nel campione . La stima di p è allora 0,24. Il campione è abbastanza grande (n=200) per costruire l’I.C. asintotico:

L’unica incognita in è che troviamo sulle tavole.    L’intervallo di confidenza a livello 0,95 è: [0,24 – 1,96 ; 0,24 + 1,96 ] = [0,1808 ; 0,299].   Si noti che stimo una percentuale per cui anche gli estremi lo sono, cioè sono numeri tra 0 e 1. Interpretazione. Il valore di p non lo conosco, non lo saprò mai, tuttavia possiamo dire che ho una confidenza elevata che p sia compreso nell’intervallo[0,1808 ; 0,299] perché

significa che su infiniti intervalli di confidenza, immaginando di estrarre infiniti campioni, il 95% di essi contiene p, ma non sappiamo con certezza se il nostro intervallo contiene p, ne abbiamo solo una confidenza elevata.