Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
1
Lezione 8 Numerosità del campione
2
parte 2 la numerosità minima del campione nei test di ipotesi
3
gli strumenti di inferenza
Dato un campione con immagini { X1, X2, …, Xn } proveniente da una popolazione su cui è definita una variabile casuale X avente densità f (x) qualsiasi con media m e varianza s2 si possono usare la media campionaria e la varianza campionaria corretta per stimare i valori dei parametri della popolazione. come tutti gli strumenti di misura, anche gli stimatori sono imperfetti e la loro stima del parametro presenta un’incertezza che viene quantificata attraverso l’intervallo di confidenza:
4
la numerosità minima del campione nei test sulla media
5
azioni decisionali sull’ipotesi H0
Come è facile vedere se il test a cui è stata sottoposta l’ipotesi H0 ha avuto esito positivo ed ha fornito informazioni sufficienti (potremmo dire: “se il test è stato utile”) l’azione decisionale è la j cioè il rifiuto di H0 : j si rifiuta H0 poiché si dispone di informazioni sufficienti a giustificare la decisione; k non si può escludere che H0 sia vera, ma non si dispone di informazioni sufficienti per esprimere un giudizio;
6
azioni decisionali sull’ipotesi H0
esempio 1: preso un campione di n elementi da una popolazione su cui è definita una variabile casuale X con media m incognita e varianza s2 conosciuta posso esprimere una decisione in merito all’ipotesi H0 : m ³ m0 ? le premesse a questo test sono le seguenti: si estrae un campione casuale dalla popolazione e si misurando i valori della caratteristica comune si definisce la variabile casuale X, si individuano i valori assunti dalla variabile casuale X in corrispondenza degli elementi che compongono il campione,
7
azioni decisionali sull’ipotesi H0
esempio 1: preso un campione di n elementi da una popolazione su cui è definita una variabile casuale X con media m incognita e varianza s2 conosciuta posso esprimere una decisione in merito all’ipotesi H0 : m ³ m0 ? questo test si conduce: definendo una opportuna variabile casuale a partire dagli stimatori campionari e fissando un valore “critico” (cioè un discriminante), calcolando il valore della variabile prescelta, confrontando tale valore con quello critico fissato e decidendo, in base al confronto, se è possibile rifiutare oppure se non è possibile rifiutare H0 : m ³ m0
8
azioni decisionali sull’ipotesi H0
esempio 1: I tecnici del Dipartimento R&D di una azienda produttrice di OpAmp affermano di avere messo a punto un nuovo layout del circuito in grado di aumentare lo slew-rate della tensione di uscita. A loro dire il nuovo valore tipico sarà maggiore o uguale a 80 mV/ns. 1) Come definiamo la variabile casuale X ? La variabile casuale X associa a ciascun punto campione un numero positivo ed adimensionale di valore uguale al valore dello slew-rate misurato in mV/ns .
9
azioni decisionali sull’ipotesi H0
esempio 1: I tecnici del Dipartimento R&D di una azienda produttrice di OpAmp affermano di avere messo a punto un nuovo layout del circuito in grado di aumentare lo slew-rate della tensione di uscita. A loro dire il nuovo valore tipico sarà maggiore o uguale a 80 mV/ns. 2) Come valutare la affermazione dei tecnici del dR&D? Dato che non sarà possibile provare l’intera popolazione (non ancora prodotta) sarà necessario agire tramite un gruppo di prototipi, cioè un campione, ed accettare l’incertezza insita nel trasferire informazioni ricavate dal campione alla intera popolazione: ovviamente si userà la media campionaria come stimatore di m.
10
azioni decisionali sull’ipotesi H0
esempio 1: I tecnici del Dipartimento R&D di una azienda produttrice di OpAmp affermano di avere messo a punto un nuovo layout del circuito in grado di aumentare lo slew-rate della tensione di uscita. A loro dire il nuovo valore tipico sarà maggiore o uguale a 80 mV/ns. 3) Come definire il valore discriminante per la media campionaria? Si fissa il discriminante ad un valore diverso da m0 , tale da individuare un campo di valori in cui, se m fosse realmente uguale a m0 , il valore della media campionaria (aleatorio a causa della aleatorietà del campione) avrebbe probabilità molto bassa di entrare.
11
azioni decisionali sull’ipotesi H0 (approccio pessimistico)
esempio 1: Il responsabile del Laboratorio Prove e Misure decide pertanto di adottare un test che prevede le seguenti fasi: 1. si costituirà un campione composto da un prestabilito numero di OpAmp, ad esempio 49 OpAmp; 2. mediante appositi strumenti si misurerà lo slew-rate di ciascun elemento del campione per ricavare i valori della X; 3. se il valore della media campionaria risulterà inferiore a 78,5 si rifiuterà l’affermazione dei tecnici del dR&D circa il preteso miglioramento; se invece tale soglia verrà uguagliata o superata non si contesterà la loro affermazione.
12
criterio decisionale sull’ipotesi H0
esempio 1: Il criterio decisionale adottato è quindi il seguente:
13
Effetto della numerosità del campione
Se il campione è “fedele” il valore della media campionaria non dipende dalla numerosità
14
Effetto della numerosità del campione
Al contrario, la incertezza dello stimatore campionario dipende dalla numerosità del campione! ?
15
Effetto della numerosità del campione
Al contrario, la incertezza dello stimatore campionario dipende dalla numerosità del campione!
16
i test sulla media: H0
17
formulazione di un test sulla media
per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ;
18
formulazione di un test sulla media
per formulare correttamente un test di ipotesi si devono seguire alcuni passi ben precisi: 1. scelta della numerosità del campione; 2. costruzione della variabile casuale X 3. individuazione della “ipotesi principale” H0 ; 4. eventuale definizione di ipotesi alternative H1 , H2 , Hj ; 5. scelta dello stimatore campionario e determinazione della sua distribuzione ; 6. definizione della affidabilità richiesta ; 7. definizione della eventuale potenza minima richiesta ; 8. determinazione del valore del/dei discriminanti ; 9. verifica della potenza ottenuta: se inferiore a quanto richiesto si torna all’inizio e si aumenta la numerosità del campione ;
19
formulazione di un test sulla media
5. si sceglie la variabile campionaria idonea a svolgere il test: se la varianza s2 è nota e se il campione è numeroso (n > 30) si potrebbero usare indifferentemente: - la media campionaria che ha distribuzione normale con media m e varianza s2 / n; - la variabile che ha distribuzione normale standard.
20
formulazione di un test sulla media
5. si sceglie la variabile campionaria idonea a svolgere il test: se la varianza s2 è nota e se il campione è numeroso (n > 30) si potrebbero usare indifferentemente: - la media campionaria che ha distribuzione normale con media m e varianza s2 / n; - la variabile che ha distribuzione normale standard. Problema: non dispongo di valori tabulati !
21
formulazione di un test sulla media
si sceglie la variabile campionaria idonea a svolgere il test: se la popolazione ha distribuzione normale con varianza s2 incognita si usa la variabile che ha distribuzione t di Student con n - 1 g.d.l. se n > 30 la variabile T può essere approssimata con la: che ha distribuzione normale standard
22
numerosità del campione: normale standard
1. si stabilisce la numerosità n del campione con cui si vuole condurre il test. per comprendere l’effetto di un aumento della numerosità del campione si può fare la seguente considerazione: supponiamo di avere scelto come variabile campionaria la: che, per n sufficientemente grande, sappiamo avere distribuzione normale standardizzata
23
numerosità del campione: normale standard
24
numerosità del campione: normale standard
25
numerosità del campione: normale standard
26
numerosità del campione: normale standard
27
numerosità del campione: t di Student
Qualora la varianza della X per l’intera popolazione non sia conosciuta si può condurre il calcolo della numerosità richiesta al campione mediante lo stimatore “varianza campionaria corretta”: Sappiamo che se n è sufficientemente grande la variabile casuale segue una distribuzione “ t di Student con n-1 g.d.l ”.
28
numerosità del campione: t di Student
29
numerosità del campione: t di Student
30
numerosità del campione: t di Student
Un problema da considerare è rappresentato dal fatto che il valore critico t1- a/2 della t di Student dipende da n
31
numerosità del campione: t di Student
Se n’min > 30 sappiamo che la distribuzione t di Student non differisce in maniera evidente dalla distribuzione normale standard. Un primo calcolo approssimato può essere condotto sostituendo al quantile della T il corrispondente quantile di una variabile Z normale standard. Individuato così un primo valore approssimato si può proseguire cercando il valore corretto di nmin mediante un procedimento iterativo:
32
numerosità del campione: t di Student
partendo da una prima valutazione del quantile della t di Student calcolato per un numero di g.d.l. pari a n’min - 1 si calcola: Con un ragionevole numero di iterazioni si può quindi individuare la numerosità richiesta al campione.
33
numerosità del campione: t di Student
Se pensiamo di dover operare con un campione di numerosità ridotta n < 30 dobbiamo ricordare che la distribuzione della media campionaria può essere considerata normale solamente se anche la X segue la distribuzione normale!!! Se ciò si verifica possiamo individuare il valore della numerosità richiesta nmin con un procedimento uguale a quello già mostrato per n > 30.
34
numerosità del campione: t di Student
Partiamo da una prima valutazione condotta con la: per poi ricalcolare iterativamente il valore di nmin partendo da una prima valutazione del quantile della t di Student calcolato per un numero di g.d.l. pari a n’min Con un ragionevole numero di iterazioni si può quindi individuare la numerosità richesta al campione.
35
la numerosità minima del campione nel test sulla varianza
36
distribuzione della varianza campionaria corretta
dato un campione con immagini { X1, X2, …, Xn } proveniente da una popolazione infinita su cui è definita una variabile casuale X con distribuzione normale, media m e varianza s2, la varianza campionaria corretta divisa per s fornisce una variabile casuale che segue una distribuzione C 2 con n - 1 gradi di libertà
37
Quantili critici nel test sulla varianza
38
numerosità del campione nel test sulla varianza
Nei vari casi le regioni di rifiuto sono:
39
Consistenza della varianza campionaria corretta
Sappiamo che Sn2 è uno stimatore corretto e consistente della varianza quindi, al crescere della numerosità n del campione, il suo valore si distribuisce in modo sempre più “concentrato in prossimità” di s2 E’ pertanto possibile ipotizzare che, per valori di n sufficientemente elevati, la casualità con cui viene estratto il campione non faccia variare in modo significativo il valore della varianza campionaria Sn2.
40
numerosità del campione ed ampiezza dell’intervallo di confidenza per la varianza
il valore di nmin non compare in modo esplicito, ma deve essere individuato attraverso i gradi di libertà della C 2 il più basso valore dei gradi di libertà per cui i valori critici della C 2 soddisfano la forma corrispondente: è pari a nmin - 1
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.