Lezione 6 Inferenza statistica
parte 3 Esercizi sulla stima della media e della varianza
Strumenti di misura e strumenti di inferenza
incertezza dello stimatore campionario estraendo da una popolazione per cui è definita la variabile casuale X avente densità f (x) qualsiasi con media m e varianza s2 un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn } si possono usare la media campionaria e la varianza campionaria corretta per stimare i valori dei parametri m e s2 relativi all’intera popolazione. come tutti gli strumenti di misura, anche gli stimatori sono imperfetti e la loro stima del parametro presenta un’incertezza che deve essere quantificata.
incertezza dello stimatore media campionaria La “probabilità” dell’evento: è uguale alla “confidenza” con cui posso affermare:
incertezza dello stimatore varianza campionaria corretta La “probabilità” dell’evento: è uguale alla “confidenza” con cui posso affermare:
incertezza degli stimatori campionari La determinazione dell’incertezza degli stimatori campionari si conduce tramite lo studio della distribuzione di probabilità della variabile casuale costituita dallo stimatore.
Riassunto stimatori campionari varianza campionaria corretta: se si estrae da una popolazione su cui è definita la variabile casuale X avente distribuzione normale un campione di n elementi con immagini { X1, X2, …, Xn } (con n > 1) , allora la variabile casuale c 2 : segue una distribuzione di tipo “chi-quadro” con n -1 gdl.
La variabile c2 f ( c² ) c²
Riassunto stimatori campionari varianza campionaria corretta: se si estrae da una popolazione su cui è definita la variabile casuale X avente distribuzione normale un campione di n elementi con immagini { X1, X2, …, Xn } (con n > 1) , allora la variabile casuale C 2 : segue una distribuzione di tipo “modificata di chi-quadro” con n -1 gradi di libertà.
La variabile C2 f ( C ² ) C ²
Incertezza dello stimatore Sn2 Chiediamoci ora: “ Qual è la probabilità che, estraendo a caso un campione di n elementi da una popolazione su cui è stata definita una variabile casuale X con distribuzione normale, il rapporto fra la varianza campionaria corretta e la varianza relativa all’intera popolazione sia compreso nell’intervallo ? ”
Incertezza dello stimatore Sn2
Incertezza dello stimatore Sn2
Incertezza dello stimatore Sn2 Estraendo a caso un campione di n elementi da una popolazione per cui è definita una variabile casuale X con distribuzione normale, media m e varianza s 2, c’è una probabilità pari a: che il rapporto fra il valore ottenuto della varianza campionaria corretta e la varianza della X per l’intera popolazione sia compreso nell’intervallo
Incertezza dello stimatore Sn2
Incertezza dello stimatore Sn2
Incertezza dello stimatore Sn2
Incertezza dello stimatore Sn2 Chiediamoci ora: “ Qual è la probabilità che, estraendo a caso un campione di n elementi da una popolazione su cui è stata definita una X con distribuzione normale, il rapporto fra la varianza campionaria corretta e la varianza relativa all’intera popolazione sia compreso nell’intervallo ? ”
Intervallo di confidenza per la varianza Per il nostro scopo, cioè per individuare l’intervallo di confidenza della varianza, conviene sviluppare l’espressione dell’evento in modo diverso: si può scrivere nelle due forme equivalenti:
Intervallo di confidenza per la varianza campionaria corretta Sn2 si è quindi ricavato che è uguale a o, in modo equivalente, è uguale a: è quindi possibile fare la seguente affermazione:
Intervallo di confidenza a (1 – a ) possiamo quindi sostenere che: estraendo a caso un campione di n elementi da una popolazione per cui è definita una variabile casuale X con distribuzione normale, media m e varianza s2, c’è una probabilità 1 - a pari a che l’intervallo casuale contenga il valore della varianza s2 per l’intera popolazione. I1-a è l’intervallo di confidenza allo 1 - a per la varianza
Riassunto varianza campionaria corretta: Qual è la probabilità che il rapporto fra i valori della varianza campionaria corretta Sn2 e della varianza s2 riferita all’intera popolazione sia compreso nell’intervallo [ 1 - ev , 1 + ev ] ? se la X ha distribuzione normale la probabilità cercata corrisponde alla :
Riassunto varianza campionaria corretta: Qual è la probabilità che il rapporto fra i valori della varianza campionaria corretta Sn2 e della varianza s2 riferita all’intera popolazione sia compreso nell’intervallo [ 1 - ev , 1 + ev ] ?
Riassunto varianza campionaria corretta: Qual è la probabilità che il rapporto fra i valori della varianza campionaria corretta Sn2 e della varianza s2 riferita all’intera popolazione sia compreso nell’intervallo [ 1 - ev , 1 + ev ] ? corrisponde alla area della regione campita in verde:
Riassunto varianza campionaria corretta: Qual è quindi la probabilità che il valore della varianza s2 riferita all’intera popolazione sia compreso nell’intervallo con le nostre tavole:
Riassunto varianza campionaria corretta: Qual è quindi la probabilità che il valore della varianza s2 riferita all’intera popolazione sia compreso nell’intervallo con le nostre tavole:
Intervallo di confidenza allo ... ? per bassi valori di n la f (C 2 ) non è simmetrica pertanto non è agevole individuare il valore di ev da cui si ottiene un intervallo simmetrico con una prestabilita confidenza esempio: a = 0,10 gdl = 10 C2 0,05 = 0,394 da cui: ev » 0,6 0,05 0,10 da cui a = 0,15 pertanto 1 - a = 0,85 e non 0,90 !!!
Intervallo di confidenza allo 0,90 per bassi valori di n la f (C 2 ) non è simmetrica: si preferisce pertanto definire un intervallo asimmetrico individuato dai due quantili e esempio: a = 0,10 gdl = 10 0,05 0,05
Intervallo di confidenza varianza campionaria corretta: Qual è l’intervallo di confidenza della varianza per la intera popolazione corrispondente ai due quantili e corrispondenti alla confidenza scelta? corrisponde alla:
Intervallo di confidenza varianza campionaria corretta: Qual è l’intervallo di confidenza della varianza per la intera popolazione corrispondente ai due quantili e corrispondenti alla confidenza scelta? l’intervallo cercato è:
Intervallo di confidenza varianza possiamo sostenere che: estraendo a caso un campione da una popolazione su cui è definita una variabile casuale X con distribuzione normale, media m e varianza s2, c’è una probabilità pari a 1 - a che l’intervallo casuale in cui e sono rispettivamente i valori del quantile (a/2) e del quantile (1 - a/2) di una variabile C 2 che segue la distribuzione “modificata di chi-quadro” con n -1 g.d.l contenga il valore della varianza s2.
Stima intervallo di confidenza con c2 varianza campionaria: avendo introdotto la distribuzione “chi-quadro” è stato possibile affermare che la variabile aleatoria c2 segue tale distribuzione con n - 1 g.d.l..
Stima intervallo di confidenza con c2 varianza campionaria: se dispongo dei valori della c2
Esercizio 1 stima per intervalli della varianza
Esercizio 1 Supponiamo di avere una popolazione di induttori per la soppressione di rumori e su tale popolazione definiamo una variabile casuale X che assume, per ciascun induttore, valore uguale al valore della induttanza misurata in mH alla frequenza di 1,0 MHz. Vogliamo individuare l’intervallo di confidenza allo 0,95 per la varianza della X mediante l’uso di un campione composto da n = 26 induttori.
Esercizio 1 Alla frequenza di 1,0 MHz la induttanza può essere misurata con l’uso di un “ponte per radio frequenza”
Esercizio 1 dai valori misurati determino prima il valore dello stimatore “media campionaria” e poi il valore dello stimatore “varianza campionaria corretta” nel nostro caso il campione di 26 induttori ci porta a:
Esercizio 1 Se la induttanza degli induttori presenta una variabilità provocata da molteplici cause legate al processo produttivo che agiscono indipendentemente le une dalle altre allora è plausibile assumere che la variabile X che è stata definita presenti una distribuzione di tipo normale. Se la variabile X ha una distribuzione di tipo normale con media m e varianza s2 allora è possibile affermare che una nuova variabile casuale C2 definita dal rapporto fra la varianza campionaria corretta e la varianza della popolazione s2 segue una distribuzione di tipo “modificata di chi quadro”
Intervallo di confidenza allo 0,95 Esercizio 1 il campione è composto da n= 26 elementi pertanto opero con 25 g.d.l. Dalle tabelle dei valori critici di C ²25 trovo che i valori dei due quantili 0,025 e 0,975 sono rispettivamente: 0,52 e 1,62 Intervallo di confidenza allo 0,95
Esercizio 2 stima per intervalli della varianza
Esercizio 2 Un campione è costituito da 11 resistori estratti da una popolazione infinita con distribuzione normale. La misurazione della resistenza degli elementi del campione fornisce i seguenti valori, in kW: 12,1 ; 12,2 ; 12,2 ; 12,2 ; 12,3 ; 12,3 ; 12,3 ; 12,4 ; 12,4 ; 12,4 ; 12,5 ; Viene definita una variabile casuale X che assume, per ciascun resistore della popolazione, valore uguale a quello della resistenza in kW diminuito di 12. Si individui l’intervallo di confidenza allo 0,95 per la varianza della X.
Esercizio 2 dai valori misurati determino prima il valore dello stimatore “media campionaria” e poi il valore dello stimatore “varianza campionaria corretta”
Esercizio 2 Se la resistenza dei resistori studiati presenta una variabilità provocata da molteplici cause legate al processo produttivo che agiscono indipendentemente le une dalle altre allora è plausibile assumere che la variabile X che è stata definita presenti una distribuzione di tipo normale. Se la variabile X ha una distribuzione di tipo normale con media m e varianza s2 allora è possibile affermare che una nuova variabile casuale C2 definita dal rapporto fra la varianza campionaria corretta e la varianza della popolazione s2 segue una distribuzione di tipo “modificata di chi-quadro”
Intervallo di confidenza allo 0,95 Esercizio 2 il campione è composto da n= 11 elementi quindi opero con 10 g.d.l. Dalla tabella, per C ²10 trovo che i valori dei due quantili 0,025 e 0,975 sono rispettivamente: 0,325 e 2,05 Intervallo di confidenza allo 0,95
Esercizio 3 stima per intervalli della varianza
Esercizio 3 Un campione è costituito da 31 resistori estratti da una popolazione infinita con distribuzione normale. Viene definita una variabile casuale X che assume, per ciascun resistore della popolazione, valore uguale a quello della resistenza in kW diminuito di 12. La misurazione della resistenza degli elementi del campione fornisce: Si individui l’intervallo di confidenza allo 0,95 per la varianza della X usando sia la distribuzione “modificata di chi-quadro” sia la distribuzione “chi-quadro”.
Esercizio 3 Se la resistenza dei resistori studiati presenta una variabilità provocata da molteplici cause legate al processo produttivo che agiscono indipendentemente le une dalle altre allora è plausibile assumere che la variabile X che è stata definita presenti una distribuzione di tipo normale. Se la variabile X ha una distribuzione di tipo normale con media m e varianza s2 allora è possibile affermare che una nuova variabile casuale C2 definita dal rapporto fra la varianza campionaria corretta e la varianza della popolazione s2 segue una distribuzione di tipo “modificata di chi quadro”
Esercizio 3 Se la resistenza dei resistori studiati presenta una variabilità provocata da molteplici cause legate al processo produttivo che agiscono indipendentemente le une dalle altre allora è plausibile assumere che la variabile X che è stata definita presenti una distribuzione di tipo normale. Se la variabile X ha una distribuzione di tipo normale con media m e varianza s2 allora è possibile affermare che una nuova variabile casuale c2 definita dal rapporto fra la varianza campionaria corretta e la varianza della popolazione s2 moltiplicato per n-1 segue una distribuzione di tipo “chi quadro”
Intervallo di confidenza allo 0,95 Esercizio 3 il campione è composto da n= 31 elementi quindi opero con 30 g.d.l. dalla tabella dei valori critici di C ²30 trovo che i valori dei due quantili 0,025 e 0,975 sono rispettivamente: 0,560 e 1,57 Intervallo di confidenza allo 0,95
Intervallo di confidenza allo 0,95 Esercizio 3 il campione è composto da n= 31 elementi pertanto opero con una distribuzione chi-quadro a 30 g.d.l. Dalle tabelle della f. cumulativa di c²30 trovo che i valori dei due quantili 0,025 e 0,975 sono rispettivamente: 16,791 e 46,979 Intervallo di confidenza allo 0,95
Esercizio 4 stima per intervalli della varianza
Esercizio 4 Si è definita su di una popolazione di sfere da cuscinetto una variabile casuale avente, per ciascuna sfera prodotta, valore uguale al valore del diametro misurato in centimetri. Un campione casuale costituito da 41 sfere mostra un valore della media campionaria di 0,824 e della deviazione standard campionaria corretta di 0,042. Determinare l’intervallo di confidenza al 99% per la varianza della variabile casuale relativa all’intera popolazione.
Esercizio 4 Anche in questo esercizio dovremo assumere che la variabilità del diametro della sfere sia provocata da molteplici cause legate al processo produttivo che agiscono indipendentemente le une dalle altre allora. Con questa premessa è plausibile assumere che la variabile X che è stata definita presenti una distribuzione di tipo normale. Se la variabile X ha una distribuzione di tipo normale con media m e varianza s2 allora è possibile affermare che una nuova variabile casuale C2 definita dal rapporto fra la varianza campionaria corretta e la varianza della popolazione s2 segue una distribuzione di tipo “modificata di chi quadro”
Intervallo di confidenza allo 0,99 Esercizio 4 il campione è composto da n= 41 elementi pertanto opero con la tabella dei valori critici della C ² per 40 g.d.l. dalla tabella trovo che i valori dei due quantili 0,005 e 0,995 sono rispettivamente: 0,518 e 1,67 Intervallo di confidenza allo 0,99
Intervallo di confidenza allo 0,99 Esercizio 4 il campione è composto da n= 41 elementi pertanto opero con una distribuzione chi-quadro a 40 g.d.l. Dalle tabelle della f. cumulativa di c ²40 trovo che i valori dei due quantili 0,005 e 0,995 sono rispettivamente: 20,707 e 66,766 Intervallo di confidenza allo 0,99
Esercizio 5 stima per intervalli della varianza
Esercizio 5 Ricalcolare l’intervallo di confidenza dell’esercizio precedente nell’ipotesi che il campione sia costituito da 21 sfere. Un campione casuale costituito da 21 sfere mostra un valore della media campionaria di 0,824 e della deviazione standard campionaria corretta di 0,042. Determinare l’intervallo di confidenza al 99% per la varianza della variabile casuale relativa all’intera popolazione.
Esercizio 5 il campione è composto da n= 21 elementi pertanto opero con 20 g.d.l. dalla tabella della f. cumulativa di c ²20 trovo che i valori dei due quantili 0,005 e 0,995 sono rispettivamente: 7,434 e 39,997
Intervallo di confidenza allo 0,99 Esercizio 5 il campione è composto da n= 21 elementi pertanto opero con 20 g.d.l. dalla tabella della f. cumulativa di c ²20 trovo che i valori dei due quantili 0,005 e 0,995 sono rispettivamente: 7,434 e 39,997 Intervallo di confidenza allo 0,99
Esercizio 5 il campione è composto da n= 21 elementi pertanto uso la funzione C ² con 20 g.d.l. Dalle tabelle di C ²20 trovo che i valori dei due quantili 0,005 e 0,995 sono rispettivamente: 0,372 e 2,00
Intervallo di confidenza allo 0,99 Esercizio 5 il campione è composto da n= 21 elementi pertanto uso la funzione C ² con 20 g.d.l. Dalle tabelle di C ²20 trovo che i valori dei due quantili 0,005 e 0,995 sono rispettivamente: 0,372 e 2,00 Intervallo di confidenza allo 0,99
Esercizio 6 stima per intervalli della varianza
Esercizio 6 Problema 1. Il propulsore Mod. WEC viene prodotto da ACME Inc. mediante un processo automatizzato: dati storici confermano che la lavorazione di ogni elemento prodotto richiede tipicamente 1 ora e 40 minuti (1h 40min 00s): questo valore viene assunto come valore tipico per l'intera popolazione. Un esperto di organizzazione aziendale suggerisce alla dirigenza di ACME la introduzione di una nuova macchina affermando che tale azione può ridurre in modo significativo il tempo di lavorazione necessario per realizzare il propulsore WEC. A causa dei costi di esercizio della nuova macchina la dirigenza di ACME valuta che la sua introduzione risulta economicamente conveniente solamente nel caso in cui il tempo di lavorazione necessario per realizzare il propulsore WEC si riduca fino ad assumere un valore tipico per l'intera popolazione minore di 1 ora e 32 minuti (1h 32min 00s). La dirigenza di ACME, con la collaborazione del costruttore della nuova macchina che ne mette a disposizione un esemplare affinché sia possibile sperimentarne il funzionamento, decide di condurre un test statistico allo scopo di confermare la effettiva utilità dell’acquisto della nuova macchina. Il test sarà condotto con un livello di significatività pari a 0,01. Mediante la nuova macchina vengono realizzati 6 esemplari di propulsore WEC misurando, per ciascuno di essi, il tempo di lavorazione: propulsore WEC #1 tempo di lavorazione = 1h 31min 06s propulsore WEC #2 tempo di lavorazione = 1h 31min 24s propulsore WEC #3 tempo di lavorazione = 1h 31min 36s propulsore WEC #4 tempo di lavorazione = 1h 31min 42s propulsore WEC #5 tempo di lavorazione = 1h 31min 48s propulsore WEC #6 tempo di lavorazione = 1h 32min 00s In base al risultato del test i dirigenti di ACME decidono di acquistare la nuova macchina oppure no? Problema 3. Si individui l’intervallo di confidenza al 95% per la varianza s2 della X riferita all’intera popolazione sulla base dei valori forniti dal campione del problema 1.
Esercizio 6 Problema 1. Il propulsore Mod. WEC … Mediante la nuova macchina vengono realizzati 6 esemplari di propulsore WEC misurando, per ciascuno di essi, il tempo di lavorazione: propulsore WEC #1 tempo di lavorazione = 1h 31min 06s propulsore WEC #2 tempo di lavorazione = 1h 31min 24s propulsore WEC #3 tempo di lavorazione = 1h 31min 36s propulsore WEC #4 tempo di lavorazione = 1h 31min 42s propulsore WEC #5 tempo di lavorazione = 1h 31min 48s propulsore WEC #6 tempo di lavorazione = 1h 32min 00s In base al risultato del test i dirigenti di ACME decidono di acquistare la nuova macchina oppure no? Problema 3. Si individui l’intervallo di confidenza al 95% per la varianza s2 della X riferita all’intera popolazione sulla base dei valori forniti dal campione del problema 1.
Esercizio 6 risoluzione: La variabile casuale X con cui si descrive la durata della lavorazione viene definita come: un numero pari al tempo di lavorazione diminuito di 1 ora e 31 minuti ed espresso in multipli di 6 secondi: propulsore WEC #1 tempo di lavorazione = 1h 31min 06s x1 = 1 propulsore WEC #2 tempo di lavorazione = 1h 31min 24s x2 = 4 propulsore WEC #3 tempo di lavorazione = 1h 31min 36s x3 = 6 propulsore WEC #4 tempo di lavorazione = 1h 31min 42s x4 = 7 propulsore WEC #5 tempo di lavorazione = 1h 31min 48s x5 = 8 propulsore WEC #6 tempo di lavorazione = 1h 32min 00s x6 = 10 Con queste premesse la varianza campionaria corretta risulta:
Esercizio 6 risoluzione: Per individuare l'intervallo di confidenza della varianza della X relativa all'intera popolazione si costruisce una idonea variabile casuale c2 così definita: che ha distribuzione di tipo "chi quadro" con n-1 gradi di libertà. Si individuano quindi i due quantili della "chi quadro" relativi alle probabilità 0,025 e 0,975 che, per 5 gradi di libertà, risultano essere:
Esercizio 6 Da questi valori si individuano gli estremi dell'intervallo di confidenza cercato mediante la: Sostituendo nella espressione i valori della varianza campionaria corretta, dei quantili della "chi quadro" e dei gradi di libertà si ottiene infine:
Esercizio 6 Risoluzione alternativa: Per individuare l'intervallo di confidenza della varianza della X relativa all'intera popolazione si costruisce una idonea variabile casuale C 2 così definita: che ha distribuzione di tipo “C 2 modificata di chi quadro" con n-1 gradi di libertà. Si individuano quindi i due quantili della C 2 relativi alle probabilità 0,025 e 0,975 che, per 5 gradi di libertà, risultano essere:
Esercizio 6 Da questi valori si individuano gli estremi dell'intervallo di confidenza cercato mediante la: Sostituendo nella espressione i valori della varianza campionaria corretta, dei quantili della C 2 e dei gradi di libertà si ottiene infine: