La verifica d’ipotesi Docente Dott. Nappo Daniela

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
Come organizzare i dati per un'analisi statistica al computer?
Intervalli di confidenza
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Confronto tra 2 campioni Nella pratica è utilissimo confrontare se 2 campioni provengono da popolazioni con la stessa media: Confronti tra produzioni di.
Analisi dei dati per i disegni ad un fattore
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Test Statistici Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
Inferenza statistica per un singolo campione
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
DIFFERENZA TRA LE MEDIE
Analisi della varianza (a una via)
Appunti di inferenza per farmacisti
Alcune domande agli autori Lo studio affronta un argomento scientifico e/o clinico importante? Lo studio è originale? Lo studio è volto a provare le ipotesi.
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 6: la funzione c2
Corso di biomatematica lezione 7-2: Test di significatività
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Analisi della varianza
Verifica delle ipotesi su due campioni di osservazioni
Le distribuzioni campionarie
Tecniche descrittive Utilizzano modelli matematici per semplificare le relazioni fra le variabili in studio Il fine è la descrizione semplificata del fenomeno.
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
Regressione e correlazione
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l. SIGNIFICATIVITÀ.
ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
IL CAMPIONE.
La statistica F Permette di confrontare due varianze, per stabilire se sono o no uguali. Simile al valore t di Student o al chi quadrato, l’F di Fisher.
ANALISI STATISTICA DI DATI CAMPIONARI
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Test basati su due campioni Test Chi - quadro
Verifica di ipotesi statistiche
Def : uno stimatore è una statistica T n le cui determinazioni servono a fornire delle stime del parametro ignoto  della v.c. X in cui sono state effettuate.
REGRESSIONE LINEARE Relazione tra una o più variabili risposta e una o più variabili esplicative, al fine di costruire una regola decisionale che permetta.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Dalmine, 26 Maggio 2004 Esercitazioni di Statistica con Matlab Dott. Orietta Nicolis fttp:\ingegneria.unibg.it.
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Correlazione e regressione lineare
Accademia europea dei pazienti sull'innovazione terapeutica Lo scopo e i fondamenti della statistica negli studi clinici.
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
INTRODUZIONE ALL’ANALISI DELLA VARIANZA
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

La verifica d’ipotesi Docente Dott. Nappo Daniela

Il lemma di Neymann-Pearson Nella maggior parte dei casi, il test delle ipotesi viene costruito in modo che l’ipotesi nulla giochi un ruolo più importante dell’ipotesi alternativa nel problema di decisione che si intende affrontare. Questo significa che i due tipi di errore in cui è possibile incorrere non vengono considerati ugualmente importanti, poiché l’errore di I tipo si suppone avere conseguenze più gravi di quelle legate all’errore di II tipo. Neyman e Pearson propongono allora di prefissare un livello α di probabilità di commettere l’errore di I tipo e successivamente, condizionatamente al valore di α fissato, scegliere il test che minimizza la probabilità β di commettere l’errore di II tipo. In base al principio di Neyman-Pearson è quindi possibile definire una regione critica ottimale, scegliendo, tra i possibili test alternativi caratterizzati dallo stesso livello di significatività α, quello per il quale la probabilità β risulta minima. Una regione critica con potenza superiore a qualunque altra regione per un test di livello α viene definita regione critica ottimale e il test ad essa associato viene indicato come il test più potente.

Lega la teoria del test alla teoria della stima attraverso la funzione di verosimiglianza. Sia X = (X 1, X 2, …, X n ) un campione casuale generato da X~ f(x;θ), e si voglia verificare l’ipotesi H 0 : θ = θ 0 contro l’ipotesi H 1 : θ = θ 1. Se L (θ ; X) è la funzione di verosimiglianza di X, allora la Regione critica ottimale di ampiezza α, RCO (α), per rifiutare H 0 contro H 1 è quella regione C 0 dello spazio campionario R n che soddisfa le condizioni: Il lemma di Neymann-Pearson

Supponendo che il rapporto di verosimiglianza, RV, sia una v.c. continua sotto H 0, nel senso che per ogni 0<α<1 esista un unico valore c α tale che: allora la regione critica C sarà l’insieme dei valori per i quali risulta: In questo modo, i risultati campionari vengono ordinati secondo il valore del RV, e quelli per i quali tale rapporto è superiore a c entrano a far parte di C. Costruendo regioni critiche per tutti i valori sufficientemente elevati del RV, ad ogni a si può associare un’unica regione critica. L’insieme dei valori RV tali che costituisce la regione critica del rapporto di verosimiglianza, e il lemma di Neyman-Pearson stabilisce che, per ogni a fissato, la regione critica del RV è la migliore regione critica, definendo così un criterio per la scelta di un test ottimale. Il lemma di Neymann-Pearson

La determinazione della regione critica del RV, e quindi del test più potente di livello α, avviene in due tappe: 1.Si calcola il RV: 2.Si determina la distribuzione campionaria della v.c. sotto H 0 Il lemma di Neymann-Pearson

Il lemma individua la RCO(α) per un’ipotesi nulla H 0 semplice contro un’ipotesi alternativa H 1 anch’essa semplice, ma rimane valido anche per la verifica di un’ipotesi nulla H 0 semplice contro un’ipotesi alternativa H 1 unidirezionale. Se la statistica-test è una v.c. continua, è sempre possibile individuare una costante c tale che la probabilità di commettere un errore di primo tipo, considerato l’errore più grave, sia pari al livello a prefissato. Il lemma risponde al principio di verosimiglianza. Infatti, la condizione (1) indica la regione C 0 come l’insieme dei valori dello spazio campionario per i quali la verosimiglianza calcolata sotto H 1 risulta c volte più plausibile, in termini di verosimiglianza, di quella calcolata sotto H 0. Il lemma di Neymann-Pearson

La funzione di verosimiglianza di un campione casuale generato da una v.c. Normale con varianza σ 2 nota è:

Il lemma di Neymann-Pearson

Quindi, la RC ricavata dalla condizione (1) del lemma è:, con k costante e determinata in modo tale da rispettare la condizione (2), e cioè che la RC risulti di ampiezza α. Sotto H 0 : μ = μ 0 X~ N(μ 0, σ 2 ) Il lemma di Neymann-Pearson

Nessun’altra suddivisione dello spazio campionario di dimensione n potrà produrre una RC di ampiezza α che abbia una potenza superiore a quella determinata. La RC così definita consente di dire che l’ipotesi H 0 : μ=μ 0, viene rifiutata a favore dell’ipotesi alternativa H 1 : μ=μ 1 >μ 0, quando la media campionaria supera μ 0 di una quantità che: 1. Cresce con la varianza; 2. Diminuisce con la numerosità del campione; 3. Cresce con z α, cioè con il diminuire del valore α La RCO è stata individuata considerando il segno di (μ 1 -μ 0 ). Tale segno è risultato determinante per stabilire la direzione della RC. Invece, la conoscenza del valore numerico μ 1, specificato nell’ipotesi alternativa H 1, è risultato irrilevante. Questo significa che si sarebbe giunti alla medesima soluzione (e quindi alla stesa RCO) per qualunque valore μ 1 specificato in H 1, purché superiore a quello specificato in H 0. Quindi, la RC così trovata è una RCO, con α prefissato, per tutte le ipotesi alternative semplici tali che μ 1 >μ 0. In altre parole, la RCO è ottimale per la verifica delle ipotesi sopra specificate. Il lemma di Neymann-Pearson

Test sulla varianza La verifica d’ipotesi sulla varianza di una popolazione segue le stesse regole del test sulla media di una popolazione, ottenendo che la statistica Test si distribuirà secondo una distribuzione chi quadro con g gradi di libertà. In particolare se il valore μ e σ 2 della popolazione è non noto allora il test sarà: H 0 : σ 2 = σ 0 2 contro H 1 : σ 2 ≠ σ 0 2 e la statistica test sarà: Dove S è la varianza campionaria. La quale sotto H 0 si distribuisce come una chi quadro con n-1 gradi di libertà e sotto H 1 come una ci quadro con n-1 g.l. moltiplicata per il fattore (σ 0 / σ) 2 Se μ fosse nota la varianza campionaria diventa la somma degli scarti dalla media della popolazione al quadrato rapportata ad n In tal caso la statistica diventa:

Test sul rapporto tra le varianze di due popolazioni Nel caso in cui non si conosce nulla sulle varianze di due popolazioni è necessario effettuare un test per verificar se esse sono uguali o differenti per poi applicare il test sul confronto tra medie più appropriato. Si considerino due campioni casuali (X 11, X 12, ….,X 1n ) e (X 21, X 22,….,X 2m ) estratti rispettivamente da X 1 ~ N(μ 1, σ 2 1 ) e X 2 ~ N(μ 2, σ 2 2 ). Il caso più frequente è che le medie delle due popolazioni sono incognite, per cui è necessario verificare l’uguaglianza delle due varianze: H 0 : σ 1 2 = σ 2 2 contro H 1 : σ 1 2 ≠ σ 2 2

Test sul rapporto tra le varianze di due popolazioni Il test statistico per la verifica dell’ipotesi nulla è: Tale rapporto si distribuisce come una F di Snedecor-Fisher con n-1 e m-1 g.l. La regola di decisione sarà la seguente: Se le medie delle due popolazioni sono note, la F di Snedecor-Fisher si distribuirà con n e m g.l Osservazione Lo stesso test statistico può essere usato per l’ipotesi statistica unidirezionale, ovvero σ 1 2 > σ 2 2 In tal caso l’ipotesi nulla si rifiuta a livello α se

Il test del coefficiente di correlazione Il coefficiente di correlazione è un indice simmetrico che consente di misurare la forza del legame di interdipendenza lineare tra due variabili. Il coefficiente di correlazione è dato pertanto dal rapporto tra la covarianza (x,y), dove x e y sono due variabili quantitative, rapportata alla radice quadrata del prodotto delle varianze delle due variabili. È limitato tra -1 e 1: Assume valore -1 quando vi è perfetta correlazione negativa tra le due variabili (aumenta x e diminuisce y); Assume valore 0 quando vi è assenza di relazione tra le due variabili; Assume valore 1 quando vi è perfetta interdipendenza positiva tra le due variabili (aumenta x ed aumenta y)

Graficamente abbiamo le seguenti tre situazioni: Il test del coefficiente di correlazione y y y x x x

Il coefficiente di correlazione ha lo stesso numeratore del coefficiente di regressione ed è legato ad esso da formule di transizione. Tuttavia mentre il coefficiente di correlazione è un indice simmetrico (valuta l’interdipendenza, per cui sia x dipende da y che viceversa), il coefficiente di regressione è un indice asimmetrico, in quanto misura la dipendenza lineare di una variabile da un’altra. Ciò comporta la necessità di fare inferenza sulla correlazione tra due variabili, al fine di verificare se esiste o meno una interdipendenza tra i due caratteri. Il test del coefficiente di correlazione

Pertanto nel momento in cui il test sulla significatività del coefficiente di regressione dovesse essere rifiutato, si può procedere cn la verifica di una relazione di tipo lineare tra le due variabili. Indichiamo con R n il coefficiente di correlazione campionario, e assumendo che (X,Y) sia una v.c. Normale Bivariata, il test della significatività del coefficiente di correlazione sarà: H 0 : ρ = ρ 0 contro l’ipotesi alternativa che H 1 : ρ > ρ 0 La RC(α) è T n ≥ t α;n-2 Il test del coefficiente di correlazione

H 0 : ρ = 0 contro l’ipotesi alternativa che H 1 : ρ ≠ 0 La statistica test ottenuta da Fisher sarà: Se è vera H 0, T n ~ F g con g= n-2. Il test del coefficiente di correlazione