Lezione 8 Numerosità del campione

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

- le Medie la Moda la Mediana
Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
8) GLI INTERVALLI DI CONFIDENZA
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Le distribuzioni di probabilità continue
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
2. Introduzione alla probabilità
TAV.1 Foto n.1 Foto n.2 SCALINATA DI ACCESSO ALL’EREMO DI SANTA CATERINA DEL SASSO DALLA CORTE DELLE CASCINE DEL QUIQUIO Foto n.3 Foto n.4.
Definizione di probabilità, calcolo combinatorio,
____________________
Intervalli di confidenza
Proprietà degli stimatori
Frontespizio Economia Monetaria Anno Accademico
Fondamenti della Misurazione
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Lez. 3 - Gli Indici di VARIABILITA’
Inferenza statistica per un singolo campione
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
CONFRONTO TRA DUE MEDIE:
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
DALL'INTERVALLO DI PROBABILITÀ
Analisi della varianza (a una via)
Processi Aleatori : Introduzione – Parte I
8. Reti di Code Nella maggior parte dei processi produttivi risulta troppo restrittivo considerare una sola risorsa. Esempio: linea tandem arrivi 1 v.
Appunti di inferenza per farmacisti
Ufficio Studi UNIONCAMERE TOSCANA 1 Presentazione di Riccardo Perugi Ufficio Studi UNIONCAMERE TOSCANA Firenze, 19 dicembre 2000.
Corso di biomatematica lezione 9: test di Student
Corso di biomatematica lezione 10: test di Student e test F
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a LA STATISTICA INFERENZIALE
Esercizi x1=m-ts x2=m+ts
di cosa si occupa la statistica inferenziale?
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 7 i Test statistici
Lezione 4 Probabilità.
Lezione 7 i Test statistici
Lezione 6 Inferenza statistica
Lezione 6 Inferenza statistica
Lezione 8 La valutazione dello scarto per “fuori tolleranza”
Lezione 7 i Test statistici
Lezione 5 Strumenti statistici: campioni e stimatori
19 Lezione 21/5/04 Composizione dell'immagine 1 COMPOSIZIONE DELLIMMAGINE.
Il test di ipotesi Cuore della statistica inferenziale!
Verifica delle ipotesi su due campioni di osservazioni
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
Esercitazioni sul calcolo dei valori critici
Bando Arti Sceniche. Per poter procedere è indispensabile aprire il testo del Bando 2ROL - Richieste On Line.
Le distribuzioni campionarie
1Piero Scotto - C14. Finalità del corso Programma Materiale Requisiti Spendibilità 2Piero Scotto - C14.
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Il test del Chi-quadrato
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Lezione B.10 Regressione e inferenza: il modello lineare
Corso di Analisi Statistica per le Imprese
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Test basati su due campioni Test Chi - quadro
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
“Teoria e metodi della ricerca sociale e organizzativa”
Intervalli di confidenza
Dalmine, 26 Maggio 2004 Esercitazioni di Statistica con Matlab Dott. Orietta Nicolis fttp:\ingegneria.unibg.it.
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Introduzione all’inferenza
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
Transcript della presentazione:

Lezione 8 Numerosità del campione

parte 2 la numerosità minima del campione nei test di ipotesi

gli strumenti di inferenza Dato un campione con immagini { X1, X2, …, Xn } proveniente da una popolazione su cui è definita una variabile casuale X avente densità f (x) qualsiasi con media m e varianza s2 si possono usare la media campionaria e la varianza campionaria corretta per stimare i valori dei parametri della popolazione. come tutti gli strumenti di misura, anche gli stimatori sono imperfetti e la loro stima del parametro presenta un’incertezza che viene quantificata attraverso l’intervallo di confidenza:

la numerosità minima del campione nei test sulla media

azioni decisionali sull’ipotesi H0 Come è facile vedere se il test a cui è stata sottoposta l’ipotesi H0 ha avuto esito positivo ed ha fornito informazioni sufficienti (potremmo dire: “se il test è stato utile”) l’azione decisionale è la j cioè il rifiuto di H0 : j si rifiuta H0 poiché si dispone di informazioni sufficienti a giustificare la decisione; k non si può escludere che H0 sia vera, ma non si dispone di informazioni sufficienti per esprimere un giudizio;

azioni decisionali sull’ipotesi H0 esempio 1: preso un campione di n elementi da una popolazione su cui è definita una variabile casuale X con media m incognita e varianza s2 conosciuta posso esprimere una decisione in merito all’ipotesi H0 : m ³ m0 ? le premesse a questo test sono le seguenti: si estrae un campione casuale dalla popolazione e si misurando i valori della caratteristica comune si definisce la variabile casuale X, si individuano i valori assunti dalla variabile casuale X in corrispondenza degli elementi che compongono il campione,

azioni decisionali sull’ipotesi H0 esempio 1: preso un campione di n elementi da una popolazione su cui è definita una variabile casuale X con media m incognita e varianza s2 conosciuta posso esprimere una decisione in merito all’ipotesi H0 : m ³ m0 ? questo test si conduce: definendo una opportuna variabile casuale a partire dagli stimatori campionari e fissando un valore “critico” (cioè un discriminante), calcolando il valore della variabile prescelta, confrontando tale valore con quello critico fissato e decidendo, in base al confronto, se è possibile rifiutare oppure se non è possibile rifiutare H0 : m ³ m0

azioni decisionali sull’ipotesi H0 esempio 1: I tecnici del Dipartimento R&D di una azienda produttrice di OpAmp affermano di avere messo a punto un nuovo layout del circuito in grado di aumentare lo slew-rate della tensione di uscita. A loro dire il nuovo valore tipico sarà maggiore o uguale a 80 mV/ns. 1) Come definiamo la variabile casuale X ? La variabile casuale X associa a ciascun punto campione un numero positivo ed adimensionale di valore uguale al valore dello slew-rate misurato in mV/ns .

azioni decisionali sull’ipotesi H0 esempio 1: I tecnici del Dipartimento R&D di una azienda produttrice di OpAmp affermano di avere messo a punto un nuovo layout del circuito in grado di aumentare lo slew-rate della tensione di uscita. A loro dire il nuovo valore tipico sarà maggiore o uguale a 80 mV/ns. 2) Come valutare la affermazione dei tecnici del dR&D? Dato che non sarà possibile provare l’intera popolazione (non ancora prodotta) sarà necessario agire tramite un gruppo di prototipi, cioè un campione, ed accettare l’incertezza insita nel trasferire informazioni ricavate dal campione alla intera popolazione: ovviamente si userà la media campionaria come stimatore di m.

azioni decisionali sull’ipotesi H0 esempio 1: I tecnici del Dipartimento R&D di una azienda produttrice di OpAmp affermano di avere messo a punto un nuovo layout del circuito in grado di aumentare lo slew-rate della tensione di uscita. A loro dire il nuovo valore tipico sarà maggiore o uguale a 80 mV/ns. 3) Come definire il valore discriminante per la media campionaria? Si fissa il discriminante ad un valore diverso da m0 , tale da individuare un campo di valori in cui, se m fosse realmente uguale a m0 , il valore della media campionaria (aleatorio a causa della aleatorietà del campione) avrebbe probabilità molto bassa di entrare.

azioni decisionali sull’ipotesi H0 (approccio pessimistico) esempio 1: Il responsabile del Laboratorio Prove e Misure decide pertanto di adottare un test che prevede le seguenti fasi: 1. si costituirà un campione composto da un prestabilito numero di OpAmp, ad esempio 49 OpAmp; 2. mediante appositi strumenti si misurerà lo slew-rate di ciascun elemento del campione per ricavare i valori della X; 3. se il valore della media campionaria risulterà inferiore a 78,5 si rifiuterà l’affermazione dei tecnici del dR&D circa il preteso miglioramento; se invece tale soglia verrà uguagliata o superata non si contesterà la loro affermazione.

criterio decisionale sull’ipotesi H0 esempio 1: Il criterio decisionale adottato è quindi il seguente:

Effetto della numerosità del campione Se il campione è “fedele” il valore della media campionaria non dipende dalla numerosità

Effetto della numerosità del campione Al contrario, la incertezza dello stimatore campionario dipende dalla numerosità del campione! ?

Effetto della numerosità del campione Al contrario, la incertezza dello stimatore campionario dipende dalla numerosità del campione!

i test sulla media: H0

formulazione di un test sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ;

formulazione di un test sulla media per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ;

formulazione di un test sulla media 5. si sceglie la variabile campionaria idonea a svolgere il test: se la varianza s2 è nota e se il campione è numeroso (n > 30) si potrebbero usare indifferentemente: - la media campionaria che ha distribuzione normale con media m e varianza s2 / n; - la variabile che ha distribuzione normale standard.

formulazione di un test sulla media 5. si sceglie la variabile campionaria idonea a svolgere il test: se la varianza s2 è nota e se il campione è numeroso (n > 30) si potrebbero usare indifferentemente: - la media campionaria che ha distribuzione normale con media m e varianza s2 / n; - la variabile che ha distribuzione normale standard. Problema: non dispongo di valori tabulati !

formulazione di un test sulla media si sceglie la variabile campionaria idonea a svolgere il test: se la popolazione ha distribuzione normale con varianza s2 incognita si usa la variabile che ha distribuzione t di Student con n - 1 g.d.l. se n > 30 la variabile T può essere approssimata con la: che ha distribuzione normale standard

numerosità del campione: normale standard 1. si stabilisce la numerosità n del campione con cui si vuole condurre il test. per comprendere l’effetto di un aumento della numerosità del campione si può fare la seguente considerazione: supponiamo di avere scelto come variabile campionaria la: che, per n sufficientemente grande, sappiamo avere distribuzione normale standardizzata

numerosità del campione: normale standard

numerosità del campione: normale standard

numerosità del campione: normale standard

numerosità del campione: normale standard

numerosità del campione: t di Student Qualora la varianza della X per l’intera popolazione non sia conosciuta si può condurre il calcolo della numerosità richiesta al campione mediante lo stimatore “varianza campionaria corretta”: Sappiamo che se n è sufficientemente grande la variabile casuale segue una distribuzione “ t di Student con n-1 g.d.l ”.

numerosità del campione: t di Student

numerosità del campione: t di Student

numerosità del campione: t di Student Un problema da considerare è rappresentato dal fatto che il valore critico t1- a/2 della t di Student dipende da n

numerosità del campione: t di Student Se n’min > 30 sappiamo che la distribuzione t di Student non differisce in maniera evidente dalla distribuzione normale standard. Un primo calcolo approssimato può essere condotto sostituendo al quantile della T il corrispondente quantile di una variabile Z normale standard. Individuato così un primo valore approssimato si può proseguire cercando il valore corretto di nmin mediante un procedimento iterativo:

numerosità del campione: t di Student partendo da una prima valutazione del quantile della t di Student calcolato per un numero di g.d.l. pari a n’min - 1 si calcola: Con un ragionevole numero di iterazioni si può quindi individuare la numerosità richiesta al campione.

numerosità del campione: t di Student Se pensiamo di dover operare con un campione di numerosità ridotta n < 30 dobbiamo ricordare che la distribuzione della media campionaria può essere considerata normale solamente se anche la X segue la distribuzione normale!!! Se ciò si verifica possiamo individuare il valore della numerosità richiesta nmin con un procedimento uguale a quello già mostrato per n > 30.

numerosità del campione: t di Student Partiamo da una prima valutazione condotta con la: per poi ricalcolare iterativamente il valore di nmin partendo da una prima valutazione del quantile della t di Student calcolato per un numero di g.d.l. pari a n’min - 1 Con un ragionevole numero di iterazioni si può quindi individuare la numerosità richesta al campione.

la numerosità minima del campione nel test sulla varianza

distribuzione della varianza campionaria corretta dato un campione con immagini { X1, X2, …, Xn } proveniente da una popolazione infinita su cui è definita una variabile casuale X con distribuzione normale, media m e varianza s2, la varianza campionaria corretta divisa per s02 fornisce una variabile casuale che segue una distribuzione C 2 con n - 1 gradi di libertà

Quantili critici nel test sulla varianza

numerosità del campione nel test sulla varianza Nei vari casi le regioni di rifiuto sono:

Consistenza della varianza campionaria corretta Sappiamo che Sn2 è uno stimatore corretto e consistente della varianza quindi, al crescere della numerosità n del campione, il suo valore si distribuisce in modo sempre più “concentrato in prossimità” di s2 E’ pertanto possibile ipotizzare che, per valori di n sufficientemente elevati, la casualità con cui viene estratto il campione non faccia variare in modo significativo il valore della varianza campionaria Sn2.

numerosità del campione ed ampiezza dell’intervallo di confidenza per la varianza il valore di nmin non compare in modo esplicito, ma deve essere individuato attraverso i gradi di libertà della C 2 il più basso valore dei gradi di libertà per cui i valori critici della C 2 soddisfano la forma corrispondente: è pari a nmin - 1