Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica –

Slides:



Advertisements
Presentazioni simili
8) GLI INTERVALLI DI CONFIDENZA
Advertisements

Statistica Economica I
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
Dipartimento di Economia
STATISTICA DESCRITTIVA
STATISTICA DESCRITTIVA
Intervalli di confidenza
Proprietà degli stimatori
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento.
Fondamenti della Misurazione
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Analisi dei dati per i disegni ad un fattore
Campione e campionamento
Intervalli di Confidenza
CAMPIONE E CAMPIONAMENTO
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
La piattaforma di BI si basa essenzialmente su un sistema di metadati centralizzato che garantisce la consistenza delle informazioni e consente la navigazione.
STATISTICA A – K (60 ore) Marco Riani
Inferenza statistica per un singolo campione
Le Variabili Casuali Corso di Teoria dell’Inferenza Statistica 1
Valutazione delle ipotesi
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
CAMPIONAMENTO Estratto dal Cap. 5 di:
DALL'INTERVALLO DI PROBABILITÀ
Appunti di inferenza per farmacisti
Efisio Antonio Coppola
STATISTICA a.a PARAMETRO t DI STUDENT
Valutazione della stima: gli intervalli di confidenza
Stima dei parametri di una distribuzione
IL CAMPIONAMENTO NELLA REVISIONE CONTABILE
Cenni di teoria degli errori
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Leggere, interpretare ed utilizzare i risultati delle prove del Servizio Nazionale di Valutazione e della Prova Nazionale dellesame di stato del primo.
TECNICHE DI CAMPIONAMENTO DI POPOLAZIONI RARE O IN MANCANZA DI LISTE
Le distribuzioni campionarie
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Intervalli di fiducia.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Lezione B.10 Regressione e inferenza: il modello lineare
Un insieme limitato di misure permette di calcolare soltanto i valori di media e deviazione standard del campione, ed s. E’ però possibile valutare.
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
Martina Serafini Martina Prandi
IL CAMPIONE.
“Teoria e metodi della ricerca sociale e organizzativa”
ANALISI STATISTICA DI DATI CAMPIONARI
Le distribuzioni campionarie
Def : uno stimatore è una statistica T n le cui determinazioni servono a fornire delle stime del parametro ignoto  della v.c. X in cui sono state effettuate.
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
La variabile casuale (v.c.) è un modello matematico in grado di interpretare gli esperimenti casuali. Infatti gli eventi elementari  che compongono lo.
Intervalli di confidenza
La distribuzione campionaria della media
Università degli Studi di Ferrara Facoltà di Scienze MM.FF.NN. CdL in Tecnologie Fisiche Innovative Sistemi di Qualità, collaudi e controlli Prof. Renato.
Esercitazioni di Statistica con Matlab Dott
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Elementi di statistica e probabilità Misure Meccaniche e Termiche - Università di Cassino 2 Eventi aleatori e deterministici Un evento aleatorio può.
Università degli studi di Napoli Federico II - Facoltà di Economia Corso di laurea in Statistica per le Decisioni e l’Analisi dei Sistemi Complessi D.M.S.
Campionamento procedimento attraverso il quale si estrae, da un insieme di unità (popolazione) costituenti l’oggetto delle studio, un numero ridotto di.
Corso di Laurea Magistrale in Economia e Professioni
V - 1 Prof. Giorgio Tassinari Corso di Laurea Magistrale in Economia e Professioni Statistica per l’analisi dei dati Prima parte: il campionamento nella.
Statistica per l’economia e l’impresa Capitolo 4 MODELLO DI REGRESSIONE LINEARE SEMPLICE.
Introduzione all’inferenza
Transcript della presentazione:

Intervalli di Confidenza Corso di Teoria dell’Inferenza Statistica 2 a.a. 2003/2004 Quarto Periodo Prof. Filippo DOMMA Corso di Laurea in Statistica – Facoltà di Economia - UniCal

Intervalli di ConfidenzaF. Domma2 I metodi di stima puntuali anche se corredati di tutte le proprietà giudicate desiderabili e ottimali, difficilmente potranno fornire delle stime che coincidono con il parametro incognito, poiché ci si dovrà sempre attendere un certo errore di campionamento. Nasce, quindi, l’esigenza di associare allo stimatore una misure dell’errore di stima commesso, in modo tale da valutare quanto la stima sia da considerarsi “vicina” al parametro incognito. Tali valutazioni possono essere fatte facendo riferimento alla dispersione della distribuzione campionaria dello stimatore T(X). In relazione alla stima t(x), ottenuta tramite il campione osservato, e alla precisione dello stimatore, ci saranno dei valori di  che sulla base del campione debbono essere considerati più plausibili di altri. Definito, quindi, il grado di plausibilità si potrà dividere lo spazio parametrico in due sottoinsiemi:

Intervalli di ConfidenzaF. Domma3 uno di valori probabili per  secondo il grado di plausibilità fissato ed un altro di valori poco probabili per . Così, invece di stimare un unico valore per , si stimerà un insieme di valori possibili a cui verrà associato il grado di plausibilità scelto il quale deve essere interpretato come livello di confidenza per l’insieme.

Intervalli di ConfidenzaF. Domma4 Sia X un c.c. estratto da f(x;  ) appartenente alla famiglia di distribuzioni P. Diamo la seguente Definizione. La famiglia di intervalli S(X) di , funzione di X ma non di , è chiamato intervallo casuale. S(X) è del tipo dove e sono, rispettivamente, il limite inferiore e superiore dell’intervallo casuale.

Intervalli di ConfidenzaF. Domma5 Definizione. Per un dato valore di  (usualmente piccolo), 0<  <1, un intervallo di confidenza al 100(1-  )% per  è la realizzazione di un intervallo casuale tale che La quantità in genere è uguale ad 1- , è chiamato coefficiente fiduciario dell’intervallo casuale.

Intervalli di ConfidenzaF. Domma6 Un metodo generale per la costruzione di intervalli di confidenza è costituito dalla ricerca di una funzione del campione e del parametro incognito da stimare che abbia una distribuzione indipendente da parametro stesso.

Intervalli di ConfidenzaF. Domma7 Metodo della Quantità Pivot Definizione. Quantità Pivot. P Sia X 1,…,X n un c.c. estratto da una fd (o fp) f(x;  ) appartenente a P. Sia Q=q(X 1,…,X n ;  ) una funzione del c.c. e del parametro incognito . Se la v.c. Q ha distribuzione indipendente da , allora Q è detta quantità pivot. Definizione. Quantità Pivot. P Sia X 1,…,X n un c.c. estratto da una fd (o fp) f(x;  ) appartenente a P. Sia Q=q(X 1,…,X n ;  ) una funzione del c.c. e del parametro incognito . Se la v.c. Q ha distribuzione indipendente da , allora Q è detta quantità pivot. Se Q=q(X;  ) è una quantità pivot, allora per ogni  fissato, 0<  <1, esisteranno due valori q 1 e q 2 dipendenti da , tali che Per ogni c.o. x 1,…,x n, si ha: Ora, se da questa doppia diseguaglianza, riusciamo a calcolare la seguente:

Intervalli di ConfidenzaF. Domma8 Per funzioni t 1 e t 2 indipendenti da , allora (t 1,t 2 ) è un intervallo fiduciario (di confidenza) al 100(1-  )% per . In tal modo costruiamo un I.C. per  in due fasi: 1 a - individuare la q.p.; 2 a - invertire la doppia diseguaglianza in termini di . In tal modo costruiamo un I.C. per  in due fasi: 1 a - individuare la q.p.; 2 a - invertire la doppia diseguaglianza in termini di .

Intervalli di ConfidenzaF. Domma9 Campionamento da popolazioni Normali Sia X un c.c. iid estratto da Costruire un I.C. per  con il metodo della quantità pivot. Esistono due casi distinti: a) varianza nota; b) varianza sconosciuta. Esistono due casi distinti: a) varianza nota; b) varianza sconosciuta.

Intervalli di ConfidenzaF. Domma10 A) Varianza nota 1) Individuazione della Quantità Pivot. Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito (  ) con fd (o fp) indipendente dal parametro incognito. 1) Individuazione della Quantità Pivot. Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito (  ) con fd (o fp) indipendente dal parametro incognito. Sia X un c.c. iid estratto da N(.;.). Sappiamo che, in tale contesto, la media campionaria ha la seguente distribuzione E’ evidente che la media campionaria non è una quantità pivot.

Intervalli di ConfidenzaF. Domma11 Consideriamo la standardizzazione della media campionaria, cioè: Z è una quantità pivot per  ; infatti, si ha: 1) è funzione del c.c. X e del parametro incognito , cioè 2) Z ha distribuzione indipendente dal parametro incognito . Fissato , con 0<  <1, possiamo trovare due valori, q 1 e q 2, tali che

Intervalli di ConfidenzaF. Domma12 2) Inversione della doppia diseguaglianza in termini di  ;

Intervalli di ConfidenzaF. Domma13 La determinazione di q 1 e q 2 dipende da  e dalla fd (o fp) della q.p. Generalmente,  viene fissato ad un valore molto basso 0.01, Ripartiamo in parti uguali, sulle code della normale standardizzata,  in modo tale che Generalmente,  viene fissato ad un valore molto basso 0.01, Ripartiamo in parti uguali, sulle code della normale standardizzata,  in modo tale che

Intervalli di ConfidenzaF. Domma14 Sostituendo si ha: Gli estremi dell’intervallo casuale (T 1,T 2 ), sono: Osservato il c.c. x=(x 1,…,x n ), l’Intervallo di confidenza al 100(1-  )% per  è:

Intervalli di ConfidenzaF. Domma15 Esempio. Il termine fiduciario nasce dalla seguente osservazione: se estraessimo dalla popolazione ripetutamente campioni di dimensione n e se calcolassimo per ognuno di questi l’intervallo (t 1,t 2 ), la frequenza relativa di intervalli che contengono  tenderebbe al 100(1-  )%. Abbiamo, quindi, una considerevole fiducia che l’intervallo osservato contenga . La misura della nostra fiducia è 100(1-  )%.

Intervalli di ConfidenzaF. Domma16 B) Varianza sconosciuta 1) Individuazione della Quantità Pivot. Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito (  ) con fd (o fp) indipendente dal parametro incognito. 1) Individuazione della Quantità Pivot. Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito (  ) con fd (o fp) indipendente dal parametro incognito. Dire perché la quantità non è utile per costruire un I.C. per  con  sconosciuta.

Intervalli di ConfidenzaF. Domma17 Osservazione: Si dimostra, inoltre, che: Sappiamo che: In definitiva, la v.c. T ha distribuzione indipendente da parametri incogniti (dipende solo dai gradi di libertà n-1).

Intervalli di ConfidenzaF. Domma18 Si osservi, ora, che In definitiva, abbiamo Quest’ultima quantità è una q.p.; infatti, T è funzione di X e di , con f.d. indipendente da parametri incogniti. Individuata la q.p., fissato , possiamo trovare q 1 e q 2 tali che

Intervalli di ConfidenzaF. Domma19 2) Inversione della doppia diseguaglianza in termini di  ;

Intervalli di ConfidenzaF. Domma20 Ripartiamo in parti uguali, sulle code della t di Student,  in modo tale che La determinazione di q 1 e q 2 dipende da  e dalla fd (o fp) della q.p.

Intervalli di ConfidenzaF. Domma21 Sostituendo si ha: Gli estremi dell’intervallo casuale (T 1,T 2 ), sono: Osservato il c.c. x=(x 1,…,x n ), l’Intervallo di confidenza al 100(1-  )% per  è:

Intervalli di ConfidenzaF. Domma22 Esempio.

Intervalli di ConfidenzaF. Domma23 Osservazione - 1 Dato l’intervallo La lunghezza ( L ) dell’intervallo di confidenza è definita come differenza tra gli estremi dell’intervallo stesso, cioè Si definisce errore la lunghezza dell’intervallo diviso 2, cioè

Intervalli di ConfidenzaF. Domma24 - a parità di  : - L diminuisce al diminuire di  ; - L diminuisce all’aumentare di n. - a parità di  : - L diminuisce al diminuire di  ; - L diminuisce all’aumentare di n. - a parità di n e  : - L diminuisce all’aumentare di  [in tal caso diminuisce il grado di fiducia (1-  ) ] - a parità di n e  : - L diminuisce all’aumentare di  [in tal caso diminuisce il grado di fiducia (1-  ) ] Situazione ottima: L piccolo - (1-  ) elevato

Intervalli di ConfidenzaF. Domma25 Osservazione - 2 Fissato , a parità di  e s e della dimensione campionaria n, gli intervalli di confidenza per la media della popolazione costruiti con T sono più ampi.

Intervalli di ConfidenzaF. Domma26 Osservazione - 3 In alcuni casi, è necessario calcolare la dimensione campionaria minima affinché l’I.C. abbia una lunghezza prefissata. Così,ad esempio, nel caso di I.C. per  con  noto, si ha:

Intervalli di ConfidenzaF. Domma27 Esempio

Intervalli di ConfidenzaF. Domma28 Campionamento da popolazioni Normali Sia X un c.c. iid estratto da Esistono due casi distinti: a)  sconosciuta; b)  nota. Esistono due casi distinti: a)  sconosciuta; b)  nota. Costruire un I.C. per  2 con il metodo della quantità pivot.

Intervalli di ConfidenzaF. Domma29 A) Media sconosciuta 1) Individuazione della Quantità Pivot. Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito (   ) con fd (o fp) indipendente dal parametro incognito. 1) Individuazione della Quantità Pivot. Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito (   ) con fd (o fp) indipendente dal parametro incognito. Si è visto in precedenza che la quantità E’ evidente che V è una funzione del c.c. X e del parametro incognito   ; inoltre, si distribuisce secondo una chi-quadrato con (n-1) gradi di libertà ovvero la distribuzione non dipende da parametri incogniti. Da ciò si può concludere che V è una quantità pivot per  

Intervalli di ConfidenzaF. Domma30 2) Inversione della doppia diseguaglianza in termini di   ; Fissato , possiamo determinare q 1 e q 2 tali che

Intervalli di ConfidenzaF. Domma31 Ripartiamo in parti uguali, sulle code della Chi-quadrato,  in modo tale che La determinazione di q 1 e q 2 dipende da  e dalla fd (o fp) della q.p.

Intervalli di ConfidenzaF. Domma32 Gli estremi dell’intervallo casuale (T 1,T 2 ), sono: Osservato il c.c. x=(x 1,…,x n ), l’Intervallo di confidenza al 100(1-  )% per   è: Sostituendo si ha:

Intervalli di ConfidenzaF. Domma33 B) Media nota 1) Individuazione della Quantità Pivot. Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito (   ) con fd (o fp) indipendente dal parametro incognito. 1) Individuazione della Quantità Pivot. Per individuare la q.p. dobbiamo costruire una funzione del c.c. X e del parametro incognito (   ) con fd (o fp) indipendente dal parametro incognito. E’ evidente che V è una funzione del c.c. X e del parametro incognito   ; inoltre, si distribuisce secondo una chi-quadrato con (n) gradi di libertà ovvero la distribuzione non dipende da parametri incogniti. Da ciò si può concludere che V è una quantità pivot per  

Intervalli di ConfidenzaF. Domma34 Utilizzando lo stesso procedimento del caso (A), si ottiene l’I.C. per  2, cioè Gli estremi dell’intervallo casuale (T 1,T 2 ), sono: Osservato il c.c. x=(x 1,…,x n ), l’Intervallo di confidenza al 100(1-  )% per   è:

Intervalli di ConfidenzaF. Domma35 Esempio.

Intervalli di ConfidenzaF. Domma36 Intervallo di Confidenza per la differenza tra le medie di due popolazioni Normali. Intervallo di Confidenza per la differenza tra le medie di due popolazioni Normali. Siano X ed Y due v.c. indipendenti e normalmente distribuite, cioè

Intervalli di ConfidenzaF. Domma37 Vogliamo costruire un I.C. per la differenza tra le medie  x e  y. Primo Caso: e e Note Stimatore naturale della differenza tra le medie E’ semplice verificare che

Intervalli di ConfidenzaF. Domma38 La v.c. E’ una quantità pivot perché è funzione del c.c. (X,Y) e del parametro incognito (  x -  y ) ed ha distribuzione indipendente da parametri incogniti. Fissato , possiamo determinare q 1 e q 2 tali che E’ una quantità pivot perché è funzione del c.c. (X,Y) e del parametro incognito (  x -  y ) ed ha distribuzione indipendente da parametri incogniti. Fissato , possiamo determinare q 1 e q 2 tali che

Intervalli di ConfidenzaF. Domma39

Intervalli di ConfidenzaF. Domma40 Ricordando che

Intervalli di ConfidenzaF. Domma41 Si ottiene: Gli estremi dell’intervallo casuale (T 1,T 2 ), per la differenza tra le medie nel caso di varianze note, sono:

Intervalli di ConfidenzaF. Domma42 Osservati x=(x 1,…,x m ) e y=(y 1,…,y n ), l’I.C. per la differenza tra le medie (  x -  y ), nel caso di varianze note, al 100(1-  )% è: dove con e e

Intervalli di ConfidenzaF. Domma43 Se le varianza sono sconosciute, Z non è una quantità pivot per (  x -  y ). Secondo Caso: varianze uguali ma sconosciute Stimatore naturale della differenza tra le medie Da quanto detto in precedenza, si evince che

Intervalli di ConfidenzaF. Domma44 Si osserva, inoltre, che Poiché V 1 e V 2 sono indipendenti, dalla proprietà riproduttiva della v.c. chi-quadrato, si ha:

Intervalli di ConfidenzaF. Domma45 Dato che le v.c. Z e V 1 +V 2 sono indipendenti, possiamo costruire la v.c. t-student, cioè Tale rapporto si può scrive nel seguente modo:

Intervalli di ConfidenzaF. Domma46 dove È lo stimatore non-distorto della varianza comune  2 ; infatti, si ha:

Intervalli di ConfidenzaF. Domma47 In definitiva, la v.c. È una quantità pivot perché funzione del c.c. (X,Y) e del parametro da stimare (  x -  y ) con distribuzione che non dipende da parametri incogniti. Fissato , possiamo determinare q 1 e q 2 tali che È una quantità pivot perché funzione del c.c. (X,Y) e del parametro da stimare (  x -  y ) con distribuzione che non dipende da parametri incogniti. Fissato , possiamo determinare q 1 e q 2 tali che

Intervalli di ConfidenzaF. Domma48

Intervalli di ConfidenzaF. Domma49 Ricordando che

Intervalli di ConfidenzaF. Domma50 Sostituendo, si ottiene: Gli estremi dell’intervallo casuale (T 1,T 2 ), per la differenza tra le medie nel caso di varianze incognite ma uguali, sono:

Intervalli di ConfidenzaF. Domma51 Osservati x=(x 1,…,x m ) e y=(y 1,…,y n ), l’I.C. per la differenza tra le medie (  x -  y ), nel caso di varianze incognite ma uguali, al 100(1-  )% è: dove con e e

Intervalli di ConfidenzaF. Domma52 Esempio

Intervalli di ConfidenzaF. Domma53 Intervallo di Confidenza sulla probabilità di successo Sia X una v.c. di Bernoulli con probabilità di successo pari a . Si ricorda che E(X)=  e V(X)=  (1-  ). Dato un c.c. X 1,…,X n estratto da B( ,1), si vuole costruire un intervallo di Confidenza per  al 100(1-  )%. Consideriamo la proporzione di successi in n-prove indipendenti Sappiamo che

Intervalli di ConfidenzaF. Domma54 Dal teorema di De Moivre-Laplace, sappiamo che Si evidenzia che la v.c. Z pur essendo una q.p. (perché è funzione del c.c. e del parametro incognito ed ha distribuzione indipendente da parametri incogniti) NON può essere utilizzata per costruire un intervallo di confidenza asintotico per la probabilità di successo. Infatti, la varianza della popolazione è sconosciuta. E’ necessario quindi stimare la varianza della popolazione.

Intervalli di ConfidenzaF. Domma55 Consideriamo lo stimatore naturale della varianza della popolazione Perché essendo X i =0 oppure X i =1. Consideriamo, ora, la varianza campionaria non-distorta

Intervalli di ConfidenzaF. Domma56 Sostituiamo a V(X) lo stimatore non-distorto S 2 Si dimostra che Quest’ultima è una quantità pivot per la probabilità di successo .

Intervalli di ConfidenzaF. Domma57 Fissato , possiamo determinare q 1 e q 2 tali che

Intervalli di ConfidenzaF. Domma58 Analogamente, a quanto visto in precedenza possiamo dire che

Intervalli di ConfidenzaF. Domma59 Sostituendo abbiamo Gli estremi dell’intervallo casuale (T 1,T 2 ), per la probabilità di successo, sono:

Intervalli di ConfidenzaF. Domma60 Osservato x=(x 1,…,x m ), l’I.C. asintotico per la probabilità di successo  al 100(1-  )% è: dove

Intervalli di ConfidenzaF. Domma61 Esempio.

Intervalli di ConfidenzaF. Domma62

Intervalli di ConfidenzaF. Domma63

Intervalli di ConfidenzaF. Domma64

Intervalli di ConfidenzaF. Domma65

Intervalli di ConfidenzaF. Domma66