Lezione 6 Inferenza statistica

Slides:



Advertisements
Presentazioni simili
Training On Line - CONP. 2 Richiesta Da Menu: Conferimenti ad inizio anno termico > Agosto > Pluriennali > Nuova Richiesta Si accede alla pagina di Richiesta.
Advertisements

Numeri a 100 Electronic flashcard. 1 uno ritorno.
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Caduta non guidata di un corpo rettangolare in un serbatoio Velocità e rotazione.
8) GLI INTERVALLI DI CONFIDENZA
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Le distribuzioni di probabilità continue
1 MeDeC - Centro Demoscopico Metropolitano Provincia di Bologna - per Valutazione su alcuni servizi erogati nel.
TAV.1 Foto n.1 Foto n.2 SCALINATA DI ACCESSO ALL’EREMO DI SANTA CATERINA DEL SASSO DALLA CORTE DELLE CASCINE DEL QUIQUIO Foto n.3 Foto n.4.
1 Pregnana Milanese Assessorato alle Risorse Economiche Bilancio Preventivo P R O P O S T A.
Intervalli di confidenza
Frontespizio Economia Monetaria Anno Accademico
Fondamenti della Misurazione
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Lez. 3 - Gli Indici di VARIABILITA’
Uso dell’errore standard di misurazione
I MATEMATICI E IL MONDO DEL LAVORO
Inferenza statistica per un singolo campione
EIE 0607 III / 1 A B P a = 30 P b = 35 t = 2, tc = 1 Questo può essere un equilibrio? No! Politiche di un paese importatore: una tariffa allimportazione.
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
Esercizi x1=m-ts x2=m+ts
DALL'INTERVALLO DI PROBABILITÀ
Varianza campionaria Errore standard della varianza campionaria
La distribuzione normale e normale standardizzata
Campionamento casuale semplice
Obiettivi del corso di Statistica Medica.
DIFFERENZA TRA LE MEDIE
ELEZIONI REGIONALI 2010 PRIMI RISULTATI E SCENARI 14 aprile 2010.
Canale A. Prof.Ciapetti AA2003/04
Ufficio Studi UNIONCAMERE TOSCANA 1 Presentazione di Riccardo Perugi Ufficio Studi UNIONCAMERE TOSCANA Firenze, 19 dicembre 2000.
Realizzazione e caratterizzazione di una semplice rete neurale per la separazione di due campioni di eventi Vincenzo Izzo.
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
STATISTICA a.a PARAMETRO t DI STUDENT
Esercizi x1=m-ts x2=m+ts
Master universitario di II livello in Ingegneria delle Infrastrutture e dei Sistemi Ferroviari Anno Accademico 2012/2013 Cultura dimpresa, valutazione.
La partita è molto combattuta perché le due squadre tentano di vincere fino all'ultimo minuto. Era l'ultima giornata del campionato e il risultato era.
MP/RU 1 Dicembre 2011 ALLEGATO TECNICO Evoluzioni organizzative: organico a tendere - ricollocazioni - Orari TSC.
Cos’è un problema?.
Gli italiani e il marketing di relazione: promozioni, direct marketing, digital marketing UNA RICERCA QUANTITATIVA SVOLTA DA ASTRA RICERCHE PER ASSOCOMUNICAZIONE.
Lezione 8 Numerosità del campione
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
Lezione 7 i Test statistici
Lezione 6 Inferenza statistica
Lezione 6 Encoder ottici
Lezione 8 La valutazione dello scarto per “fuori tolleranza”
Lezione 7 i Test statistici
Lezione 5 Strumenti statistici: campioni e stimatori
Luciano giromini – la misura in psicologia, 2009 database e distribuzioni - misure di sintesi - misure di variabilità descrizione dei dati:
CHARGE PUMP Principio di Funzionamento
Settimana: 3-7 marzo Orariolunedimartedi Mercoledi 5 Giovedi 6 Venerdi lezione intro alla fis mod DR lezione intro alla fis mod DR.
Verifica delle ipotesi su due campioni di osservazioni
Pregare con i Salmi.
Esercitazione 1: Rispetto al test di ansia (Media=25; σ=5), calcolare:
Q UESTIONI ETICHE E BIOETICHE DELLA DIFESA DELLA VITA NELL AGIRE SANITARIO 1 Casa di Cura Villa San Giuseppe Ascoli Piceno 12 e 13 dicembre 2011.
1 Negozi Nuove idee realizzate per. 2 Negozi 3 4.
ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE ORDINE DI CHIAMATA a 1minuto e 2 minuti PRINCIPALI TEMPI DELLA COMPETIZIONE.
Esercitazioni sul calcolo dei valori critici
ISTITUTO COMPRENSIVO “G. BATTAGLINI” MARTINA FRANCA (TA)
Bando Arti Sceniche. Per poter procedere è indispensabile aprire il testo del Bando 2ROL - Richieste On Line.
Un trucchetto di Moltiplicazione per il calcolo mentale
Prima rilevazione sullo stato di attuazione della riforma degli ordinamenti nelle istituzioni scolastiche in LOMBARDIA Attuazione del D.L. 59/2003 a.s.
Esempi risolti mediante immagini (e con excel)
NO WASTE Progetto continuità scuola primaria scuola secondaria Salorno a.s. 2013_
I chicchi di riso e la sfida al Bramino
Il numero più grande Accademia dei Lincei
TRASFORMATA DI FOURIER
1 Ministero dell’Istruzione, dell’Università e della Ricerca Dipartimento per la Programmazione e la Gestione delle risorse umane, finanziarie e strumentali.
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
Corso di Analisi Statistica per le Imprese
Transcript della presentazione:

Lezione 6 Inferenza statistica

ERRATA CORRIGE teorema 5.1: estraendo a caso un campione di numerosità n finita da una popolazione su cui è definita una variabile casuale X con distribuzione normale, media m e varianza s2, la variabile casuale segue una distribuzione t di Student con n-1 gradi di libertà

parte 3 Esercizi sulla stima della media e della varianza

Strumenti di misura e strumenti di inferenza

incertezza dello stimatore campionario estraendo da una popolazione per cui è definita la variabile casuale X avente densità f (x) qualsiasi con media m e varianza s2 un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn } si possono usare la media campionaria e la varianza campionaria corretta per stimare i valori dei parametri m e s2 relativi all’intera popolazione. come tutti gli strumenti di misura, anche gli stimatori sono imperfetti e la loro stima del parametro presenta un’incertezza che deve essere quantificata.

incertezza dello stimatore media campionaria La “probabilità” dell’evento: è uguale alla “confidenza” con cui posso affermare:

incertezza dello stimatore varianza campionaria corretta La “probabilità” dell’evento: è uguale alla “confidenza” con cui posso affermare:

incertezza degli stimatori campionari La determinazione dell’incertezza degli stimatori campionari si conduce tramite lo studio della distribuzione di probabilità della variabile casuale costituita dallo stimatore.

Distribuzione della media campionaria

Distribuzione della media campionaria estraendo da una popolazione per cui è definita la variabile casuale X avente distribuzione qualsiasi, media m e varianza s2, un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn }, se n è sufficientemente grande la media campionaria - segue una distribuzione normale - con media m e varianza s 2 / n

Distribuzione della media campionaria estraendo da una popolazione per cui è definita la variabile casuale X con distribuzione normale, media m e varianza s 2 finite, un campione di n elementi a cui corrisponde l’insieme di variabili casuali { X1, X2, …, Xn }, per qualsiasi n la media campionaria - segue una distribuzione normale - con media m e varianza s 2 / n

Dalla media campionaria alla media campionaria standardizzata Considerazioni già fatte ci permettono di affermare che la media campionaria, sotto determinate ipotesi, segue una distribuzione normale con media m e varianza s2 / n è quindi facile costruire una variabile casuale con distribuzione normale standard, cioè con media nulla e varianza unitaria.

Intervallo di confidenza per la media possiamo sostenere che: estraendo a caso un campione con un numero n sufficiente-mente elevato elementi da una popolazione per cui è definita una variabile casuale X con distribuzione qualsiasi, media m e varianza s2, c’è una probabilità pari a 1 - a che l’intervallo casuale in cui z1-a/2 è il valore del quantile (1 - a/2) di una variabile Z normale standardizzata contenga il valore della media m per l’intera popolazione.

Intervallo di confidenza per la media: n finito possiamo sostenere che: estraendo a caso un campione con n finito da una popolazione per cui è definita una variabile casuale X con distribuzione normale, media m e varianza s2, c’è una probabilità pari a 1 - a che l’intervallo casuale in cui z1-a/2 è il valore del quantile (1 - a/2) di una variabile normale standardizzata contenga il valore della media m per l’intera popolazione.

Intervallo di confidenza per la media: n finito e s 2 sconosciuta possiamo sostenere che: estraendo a caso un campione con n finito da una popolazione su cui è definita una variabile casuale X con distribuzione normale, media m e varianza s2, c’è una probabilità pari a 1 - a che l’intervallo casuale in cui t1-a/2 è il valore del quantile (1 - a/2) di una variabile T distribuita secondo la t di Student con n -1 g.d.l. contenga il valore della media m della popolazione.

Intervallo di confidenza per la media: n finito è l’intervallo di confidenza allo 1 - a per la media m nel caso di campioni di ridotta numerosità estratti da popolazioni con distribuzione normale!

Intervallo di confidenza per la media: n < N se n ³ 30 e la varianza per la popolazione s 2 è nota: se n < 30 , X è normale e la varianza per la popolazione s 2 è nota: se X è normale:

Esercizio 1 stima della media

Esercizio 1 Determinazione dei parametri statici di un OpAmp: misurazione della tensione di offset di ingresso La tensione di offset di ingresso è quella tensione continua che, in assenza di segnale utile, deve essere applicata all’ingresso di un operazionale per rendere nulla la tensione di uscita.

Esercizio 1 Determinazione dei parametri statici di un OpAmp: misurazione della tensione di offset di ingresso

Esercizio 1 se R3 = R1 // R2

Esercizio 1 se R3 = R1 // R2

Esercizio 1 se trascuriamo il contributo di ios rispetto a quello di vos:

Esercizio 1 se trascuriamo il contributo di ios rispetto a quello di vos:

Esercizio 1 la tensione di offset di ingresso è quindi espressa dalla:

Esercizio 1 costituiamo un campione con 11 propotipi di un nuovo OpAmp e misuriamo i valori delle tensioni vout in mV usando i resistori R1 = 1 W e R2 = 1 kW: { + 17,87 ; + 18,16 ; + 17,80 ; + 17,99 ; + 18,16 ; + 17,97 ; + 18,12 ; + 17,98 ; + 17,99 ; + 17,84 ; + 17,99 } da questi ricaviamo i valori delle tensioni di offset in mV: { + 17,85 ; + 18,14 ; + 17,78 ; + 17,97 ; + 18,14 ; + 17,95 ; + 18,10 ; + 17,96 ; + 17,97 ; + 17,82 ; + 17,97 }

Esercizio 1 Sulla popolazione degli OpAmp definiamo una variabile aleatoria X che assume, per ciascun elemento della popolazione, un valore x coincidente con il valore in mV della tensione di offset dell’elemento (trasformazione lineare). A causa della molteplicità dei fattori del processo produttivo che condizionano l’offset e per la linearità della trasformazione è plausibile ritenere che la X abbia distribuzione normale. Le immagini dei componenti il campione sono: x1 = + 17,85 ; x2 = + 18,14 ; x3 = + 17,78 ; x4 = + 17,97 ; x5 = + 18,14 ; x6 = + 17,95 ; x7 = + 18,10 ; x8 = + 17,96 ; x9 = + 17,97 ; x10 = + 17,82 ; x11 = + 17,97

Esercizio 1 utilizziamo questi valori per individuare la stima del valore medio dell’offset per la intera popolazione mediante lo stimatore “media campionaria”: lo stimatore “media campionaria” ci fornisce il valore Questo risultato ci permette di affermare che la stima fatta del valore medio della tensione di offset di ingresso per l’intera popolazione di OpAmp risulta di +17,97 mV

Esercizio 1 dobbiamo ora trovare quanto il dato è “affidabile” stimando quanto la casualità del campione può condizionarne il valore: dato che non conosciamo la varianza della X per la popolazione degli OpAmp costruiamo la variabile T che avrà una distribuzione “t di Student”: attraverso cui individueremo l’intervallo di confidenza usando la:

Esercizio 1 il campione ha n = 11 quindi useremo la t di Student a 10 g.d.l. e, se cerchiamo un intervallo di confidenza al 90%, dovremo individuare i percentili 5% e 95% (cioè 0,05 e 0,95): in realtà ci basta individuare il 95% in quanto l’altro percentile è simmetrico rispetto a zero. la tabella della t di Student ci fornisce il valore del percentile: da cui:

Esercizio 1 ricordando che vogliamo applicare la: notiamo che ora è necessario stimare la varianza della media campionaria mediante la varianza campionaria corretta Dai valori della X del campione individuiamo quindi il valore della varianza campionaria corretta e della sua radice (deviazione standard):

Esercizio 1 pertanto sostituendo nella: otteniamo: da cui:

Esercizio 1 dalla: è facile ottenere: da cui: che rappresenta l’intervallo di confidenza al 90% per la media m della variabile casuale riferita all’intera popolazione

Esercizio 1 Questo risultato ci permette di affermare che, con una probabilità del 90%, il valore medio della tensione di offset di ingresso della intera popolazione degli OpAmp è compreso nell’intervallo di estremi:

Esercizio 2 stima per intervalli della media

Esercizio 2 costituiamo un campione con 16 propotipi di resistori di nuovo tipo e misuriamo i valori delle resistenze in kW: { + 15,37 ; + 15,16 ; + 15,80 ; + 15,49 ; + 15,26 ; + 15,87 ; + 15,12 ; + 15,58 ; + 15,39 ; + 15,64 ; + 15,27 ; + 15,22 ; + 15,57 ; + 15,54 ; + 15,64 ; + 15,32 } Data la molteplicità delle cause indipendenti che determinano la variabilità della resistenza è plausibile ritenerla distribuita normalmente. Costruita la variabile casuale X che assume per ciascun elemento valore pari al valore in kW della sua resistenza elettrica (è una trasformazione lineare quindi X conserva la distribuzione normale) si individui l’intervallo di confidenza al 95% per il valore tipico della resistenza della intera popolazione supponendo che la varianza della X per l’intera popolazione sia s2 = 0,0256

Esercizio 2 risoluzione: dato che la X è distribuita normalmente si costruisce la variabile che segue una distribuzione normale standardizzata

Esercizio 2 risoluzione (segue): dalla tabella si ottiene:

Esercizio 2 Questo risultato ci permette di affermare che, con una probabilità del 95%, il valore tipico della resistenza della intera popolazione dei resistori è compreso nell’intervallo di estremi:

Esercizio 1bis stima della media

Esercizio 1bis Sulla popolazione degli OpAmp definiamo una variabile aleatoria X che assume, per ciascun elemento della popolazione, un valore x coincidente con il valore in centesimi di mV della tensione di offset dell’elemento diminuito di 1800 (trasformazione lineare): A causa della molteplicità dei fattori del processo produttivo che condizionano l’offset è plausibile ritenere che la X abbia distribuzione normale. Le immagini dei componenti il campione sono pertanto x1 = -15 ; x2 = + 14 ; x3 = -22 ; x4 = - 3 ; x5 = + 14 ; x6 = - 5 ; x7 = + 10 ; x8 = - 4 ; x9 = - 3 ; x10 = - 18 ; x11 = - 3 ;

Esercizio 1bis utilizziamo questi valori per individuare la stima del valore medio dell’offset per la intera popolazione mediante lo stimatore “media campionaria”: lo stimatore “media campionaria” ci fornisce il valore Questo risultato ci permette di affermare che la stima fatta del valore medio della tensione di offset di ingresso per l’intera popolazione di OpAmp risulta di +17,97 mV

Esercizio 1bis dobbiamo ora trovare quanto il dato è “affidabile” stimando quanto la casualità del campione può condizionarne il valore: dato che non conosciamo la varianza della X per la popolazione degli OpAmp costruiamo la variabile T che avrà una distribuzione “t di Student”:

Esercizio 1bis il campione ha n = 11 quindi useremo la t di Student a 10 g.d.l. e, se cerchiamo un intervallo di confidenza al 90%, dovremo individuare i percentili 5% e 95% (cioè 0,05 e 0,95): in realtà ci basta individuare il 95% in quanto l’altro percentile è simmetrico rispetto a zero. la tabella della t di Student ci fornisce il valore del percentile: da cui:

Esercizio 1bis ricordando che vogliamo applicare la: notiamo che ora è necessario stimare la varianza della media campionaria mediante la varianza campionaria corretta Dai valori della X del campione individuiamo quindi il valore della varianza campionaria corretta e della sua radice (deviazione standard):

Esercizio 1bis pertanto sostituendo nella: otteniamo: da cui:

Esercizio 1bis dalla: è facile ottenere: da cui: che rappresenta l’intervallo di confidenza al 90% per la media m della variabile casuale X riferita all’intera popolazione

Esercizio 1bis Questo risultato ci permette di affermare che, con una probabilità del 90%, il valore tipico della tensione di offset di ingresso della intera popolazione degli OpAmp è compreso nell’intervallo di estremi:

Esercizio 2bis stima per intervalli della media

Esercizio 2bis costituiamo un campione con 16 propotipi di resistori di nuovo tipo e misuriamo i valori delle resistenze in kW: { + 15,37 ; + 15,16 ; + 15,80 ; + 15,49 ; + 15,26 ; + 15,87 ; + 15,12 ; + 15,58 ; + 15,39 ; + 15,64 ; + 15,27 ; + 15,22 ; + 15,57 ; + 15,54 ; + 15,64 ; + 15,32 } Data la molteplicità delle cause indipendenti che determinano la variabilità della resistenza è plausibile ritenerla distribuita normalmente. Costruita la variabile casuale X che assume per ciascun elemento valore pari a… (è una trasformazione lineare quindi X conserva la distribuzione normale) si individui l’intervallo di confidenza al 95% per il valore tipico della resistenza della intera popolazione supponendo che la varianza della X per l’intera popolazione sia s2 = 0,0256 * ?

Esercizio 2 Questo risultato ci permette di affermare che, con una probabilità del 95%, il valore tipico della resistenza della intera popolazione dei resistori è compreso nell’intervallo di estremi:

Esercizio 3 stima per intervalli della media

Esercizio 3 Si è definita su di una popolazione di sfere da cuscinetto una variabile casuale avente, per ciascuna sfera prodotta, valore uguale al valore del diametro misurato in centimetri. Un campione casuale costituito da 200 sfere mostra un valore della media campionaria di 0,824 e della deviazione standard campionaria corretta di 0,042. Determinare l’intervallo di confidenza al 99% per la media della variabile casuale relativa all’intera popolazione.

Esercizio 3 risoluzione: Dato che la varianza della X per l’intera popolazione è sconosciuta si dovrebbe costruire una variabile casuale T definita: per determinare la risposta al problema mediante la

Esercizio 3 risoluzione (segue): : dato che n = 200 la distribuzione della t di Student (con 199 gdl) è approssimabile con la distribuzione normale standardizzata:

Esercizio 3 risoluzione (segue): E’ quindi possibile affermare che, con una probabilità del 99%, il valore tipico del diametro per l’intera popolazione è compreso fra i valori:

Esercizio 4 stima per intervalli della media

Esercizio 4 Ricalcolare l’intervallo di confidenza dell’esercizio precedente nell’ipotesi che il campione sia costituito da 20 sfere. Un campione casuale costituito da 20 sfere mostra un valore della media campionaria di 0,824 e della deviazione standard campionaria corretta di 0,042. Determinare l’intervallo di confidenza al 99% per la media della variabile casuale relativa all’intera popolazione.

Esercizio 4 risoluzione: A causa della molteplicità dei fattori del processo produttivo che condizionano il diametro di ciascuna sfera è plausibile ritenere che la popolazione abbia distribuzione normale. E’ quindi possibile affermare che, con una probabilità del 99%, il valore medio del diametro per l’intera popolazione è compreso fra i valori:

Esercizio 5 stima per intervalli della media

Esercizio 5 Che risultato si sarebbe ottenuto nell’esercizio precedente usando, erroneamente, la teoria dei campioni numerosi? Un campione casuale costituito da 20 sfere mostra un valore della media campionaria di 0,824 e della deviazione standard campionaria corretta di 0,042. Determinare l’intervallo di confidenza al 99% per la media della variabile casuale relativa all’intera popolazione.

Esercizio 5 risoluzione: mentre abbiamo visto che il risultato corretto è:

Tecnica delle misurazioni applicate – Esame del 27 marzo 2008 Problema 1. Microlè SpA è un’impresa che costruisce relè per la commutazione di segnali. Essa dichiara sul suo catalogo che la resistenza parassita dei contatti (chiusi) dei propri relè è garantita, tramite un controllo di qualità sul 100% della produzione, non superiore a 10,2 mW. Un nuovo progetto di un modello di relè in produzione da tempo sembra poter apportare benefici, ma l’ing. Tizio, Responsabile della Produzione, teme che la resistenza parassita dei contatti dei nuovi relè possa avere una elevata variabilità: ciò potrebbe riflettersi in un aumento della percentuale di dispositivi “fuori tolleranza” che dovranno pertanto essere scartati durante il controllo di qualità del prodotto. L’ing. Tizio decide di condurre una valutazione, su di una preserie campione, del valore dello “scarto per fuori tolleranza” che il nuovo progetto potrebbe determinare. Realizzata una preserie di 16 elementi Tizio misura con uno strumento di elevata qualità (tanto da poter ritenere trascurabile la incertezza di misura) la resistenza parassita Rp dei contati chiusi di ciascun relè ottenendo i seguenti risultati: Rp1 = 9,5 mW Rp2 = 9,6 mW Rp3 = 9,6 mW Rp4 = 9,7 mW Rp5 = 9,7 mW Rp6 = 9,7 mW Rp7 = 9,8 mW Rp8 = 9,8 mW Rp9 = 9,8 mW Rp10 = 9,8 mW Rp11 = 9,9 mW Rp12 = 9,9 mW Rp13 = 9,9 mW Rp14 = 10,0 mW Rp15 = 10,0 mW Rp16 = 10,1 mW Si chiede al candidato di determinare, sulla base dei risultati sopra riportati: l’intervallo di valori della Rp che corrisponde all’intervallo di confidenza al 90% per la media della variabile casuale che si è adottata. Il valore massimo e minimo dello scarto che può essere atteso per l’intera popolazione dei relè eventualmente prodotti in base al nuovo progetto (si operi con una confidenza del 90% nella determinazione della varianza della variabile casuale che si è adottata).