Proprietà degli stimatori
Lo stimatore del parametro θ è la statistica T=t(X1,X2,…,Xn), ovvero la funzione delle osservazioni campionarie, utilizzata per assegnare un valore al parametro incognito
Stima puntuale e stimatore La stima può essere considerata come una realizzazione della variabile casuale chiamata stimatore di Esempio: campione osservato (2,5,3,6,4,4,1,2,2,5) Parametro: media della popolazione. Stimatore: media campionaria Stima: 3
Stima puntuale e stimatore Lo stimatore, dipendendo dal campione, è una variabile casuale e quindi possiede una distribuzione campionaria la cui conoscenza permette di capire se lo stimatore scelto produrra con elevata probabilità stime “vicine al valore vero del parametro. 4
Proprietà degli stimatori Per valutare la “bontà” di uno stimatore si può guardare alle sue proprietà: Proprietà per finito: Correttezza Efficienza Proprietà per (asintotiche): Consistenza Correttezza asintotica 5
Proprietà degli stimatori Correttezza Lo stimatore è uno stimatore corretto di se Per tutti i possibili valori di La distorsione di uno stimatore è uguale a: 6
Proprietà degli stimatori Per valutare la prossimità di a possiamo usare l’errore quadratico medio (mean square error) dato dalla quantità: Proprietà: dove Diremo che è più efficiente di se Per tutti i possibili valori di .
Precisione e accuratezza di uno stimatore Accuratezza: capacità di uno stimatore di essere corretto in media. Uno stimatore non accurato è distorto. Il BIAS è l’errore sistematico, non casuale, in cui i valori tendono ad essere non accurati in una precisa direzione Precisione (riproducibilità o attendibilità): capacità di un certo stimatore di fornire lo stesso risultato o uno molto simile con stime ripetute dello stesso parametro. L’errore casuale da solo, se grande, può determinare mancanza di precisione. L’errore quadratico medio include in sé sia la misura dell’accuratezza (Bias) sia la misura della precisione (Varianza)
Accuratezza e precisione Distorsione, precisione Accuratezza, non precisione Distorsione, non precisione
Proprietà degli stimatori Nella figura sono riportate le distribuzioni campionarie di due stimatori corretti. lo stimatore (linea rossa) possiede un errore quadratico medio (ossia una varianza) più piccolo di (linea nera). 10
Sufficienza: Uno stimatore sufficiente è tale se raccoglie ed esaurisce tutte le informazioni riguardanti contenute nel campione casuale (x1,x2,…,xn) Sono stimatori sufficienti: θ
Proprietà per grandi campioni Consistenza: Uno stimatore Tn è consistente in probabilità per θ se: Correttezza asintotica:
Stima puntuale della media della popolazione Si consideri una popolazione con media e varianza La media campionaria è uno stimatore corretto per la media della popolazione, ossia La varianza della media campionaria è pertanto è uno stimatore consistente, poiché Se la popolazione è distribuita come una Normale, allora anche la media campionaria si distribuisce come una Normale 13
Stima puntuale della proporzione della popolazione Si consideri una popolazione distribuita come una Bernoulli con parametro . La media campionaria è uno stimatore corretto della proporzione della popolazione, ossia La varianza della media campionaria è pertanto è uno stimatore consistente, poiché 14
Stima puntuale della varianza della popolazione Si consideri una popolazione con media e varianza entrambe ignote. Si definisce varianza campionaria corretta lo stimatore: è uno stimatore corretto della varianza della popolazione , ossia è uno stimatore consistente per , ossia 15
Stima per intervallo Sia X una v.c. che rappresenta un carattere osservato su una popolazione. Supponiamo che la v.c. sia definita da una funzione di probabilità dipendente dal parametro incognito. Sia un campione di dimensione e il corrispondente campione osservato. Obiettivo: Determinare due statistiche campionarie: tali che per ogni possibile campione e che l’intervallo contenga il parametro con probabilità 16
Stima per intervallo L’intervallo casuale si definisce intervallo di confidenza di livello per il parametro se contiene con probabilità il parametro ignoto della popolazione, ossia: In genere si fissano valori di pari a 0,99; 0,95; 0,90 e viene detto livello di confidenza. Una volta estratto il campione si ottiene l’intervallo di confidenza stimato. Nota: Non è possibile sapere se l’intervallo stimato contenga o meno il valore vero del parametro; d’altra parte se si estraesse dalla popolazione un numero sufficientemente elevato di campioni e calcolassimo i corrispondenti intervalli di confidenza, circa il di questi conterrebbe il parametro ignoto. 17
Stima per intervallo - esempio Esempio (continua) Nella seguente figura si mostrano, in corrispondenza di 6 campioni osservati, gl’intervalli di confidenza stimati per la media della popolazione a un livello di confidenza 0,95. Osserviamo che dal campione 5 si ottiene un intervallo stimato che non contiene il vero parametro della popolazione. 18