Corso di Analisi Statistica per le Imprese RICHIAMI DI INFERENZA: INTERVALLI DI CONFIDENZA Prof. L. Neri a.a. 2014-2015
Stima puntuale e stima intervallare Esistono due tipi fondamentali di stimatori: Stimatore puntuale Stimatore intervallare Stimatore puntuale: singola statistica che viene usata per stimare il vero valore di un parametro della popolazione. Ad esempio la media campionaria è uno stimatore puntuale della media della popolazione , la varianza campionaria è uno stimatore puntuale della varianza della popolazione 2.
Stima puntuale e stima intervallare Stimatore intervallare: intervallo di valori che ha una certa probabilità o confidenza di comprendere il vero valore del parametro della popolazione. In generale il livello di confidenza è indicato con (1-)% dove è la probabilità che si trova nelle code della distribuzione, al di fuori dell’intervallo di confidenza (la probabilità della coda sinistra e della coda destra coincidono e sono pari a /2).
Intervallo di confidenza per la media noto il valore dello scarto quadratico medio La statistica per costruire intervalli di confidenza per la media è ovvero una distribuzione Normale standardizzata, “indipendentemente” dalla distribuzione originale della variabile X (per campioni sufficientemente grandi). Da tale distribuzione scaturiscono gli estremi dell’intervallo di confidenza per la media.
Intervallo di confidenza per la media noto il valore dello scarto quadratico medio della popolazione
Intervalli di confidenza Curva normale per determinare il valore di Z necessario per un livello di confidenza del 95% Curva normale per determinare il valore di Z necessario per un livello di confidenza del 99%
Intervalli di confidenza Intervalli di confidenza per cinque diversi campioni di ampiezza n=25, estratti da una popolazione normale con μ = 368 e σ = 15
Esempio intervallo di confidenza Una partita di bulloni presenta un diametro medio incognito, la varianza del diametro invece è pari a 0.01. Si estrae un campione di n=1000 bulloni sui quali si osserva un diametro medio di 1.2 cm. Si determini un intervallo di confidenza al 99% (fissato un livello di confidenza del 99%). Soluzione: 1-α=0.99→ α=0.01 → α/2=0.005 →1-α/2=0.995 Dalle tavole della distribuzione Normale (vedi Tavole_Statistiche.pdf) si ha che Z(0.995) è circa =2.576 per cui l’intervallo al 99% è
Intervalli di confidenza per la media Con scarto quadratico medio della popolazione incognito La statistica per costruire intervalli di confidenza per la media è t ha una distribuzione t di Student con n-1 gradi di libertà. Il significato dei gradi di libertà è legato al fatto che per calcolare S è necessario conoscere la media campionaria. In tal caso solo n-1 valori campionari sono liberi di variare perché l’n-esimo sarà determinato automaticamente per differenza.
Intervalli di confidenza per la media Con scarto quadratico medio della popolazione incognito All’aumentare dei gradi di libertà, la distribuzione t si avvicina progressivamente alla distribuzione normale fino a che le due distribuzioni risultano virtualmente identiche.
Intervalli di confidenza per la media Con scarto quadratico medio della popolazione incognito Le tavole della distribuzione t di Student forniscono la probabilità (l’area sottesa) a destra del valore indicato.
Intervalli di confidenza per la media Con scarto quadratico medio della popolazione incognito L’intervallo di confidenza di livello (1-)% per la media con ignoto è definito come segue:
Intervallo di confidenza per una proporzione Per ricavare l’intervallo di confidenza per la proporzione della popolazione p, che ha una certa caratteristica, si utilizza la proporzione campionaria ps. Se il prodotto np e anche n(1-p) sono uguali almeno a 5, la distribuzione di ps può essere approssimata alla distribuzione Normale. L’errore standard della proporzione è dato da
Intervallo di confidenza per una proporzione Fissato il livello di confidenza (1-α)%.
Esempio Un’azienda produttrice di lamette commissiona un’indagine campionaria su una popolazione di uomini. Si seleziona un campione di numerosità n=100. Su tale campione si stima che il 40% degli uomini preferisce le lamette prodotte dall’azienda in questione. Si determini un’intervallo di confidenza al 95% per la stima della proporzione nella popolazione.
Esempio ovvero l'intervallo di confidenza per p è 0.40±0.098=[0.302,0.498]