Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
8) GLI INTERVALLI DI CONFIDENZA
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
L’Analisi della Varianza ANOVA (ANalysis Of VAriance)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
LA VARIABILITA’ IV lezione di Statistica Medica.
Intervalli di confidenza
Proprietà degli stimatori
Variabili casuali a più dimensioni
Fondamenti della Misurazione
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Analisi dei dati per i disegni ad un fattore
Progetto Pilota 2 Lettura e interpretazione dei risultati
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Test Statistici Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Analisi Bivariata e Test Statistici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.
Corso di Calcolo delle Probabilità e Statistica II Parte – STATISTICA
Inferenza statistica per un singolo campione
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
DIFFERENZA TRA LE MEDIE
Analisi della varianza (a una via)
1 Introduzione alla statistica per la ricerca Lezione III Dr. Stefano Guidi Siena, 18 Ottobre 2012.
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 10: test di Student e test F
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a LA STATISTICA INFERENZIALE
di cosa si occupa la statistica inferenziale?
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 7 i Test statistici
Il test di ipotesi Cuore della statistica inferenziale!
Verifica delle ipotesi su due campioni di osservazioni
METODI E CONTROLLI STATISTICI DI PROCESSO
Le distribuzioni campionarie
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Corso di biomatematica lezione 7-3: Test di significatività
La verifica delle ipotesi
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.
Il test del Chi-quadrato
Analisi Bivariata: Test Statistici
La verifica d’ipotesi Docente Dott. Nappo Daniela
ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Un insieme limitato di misure permette di calcolare soltanto i valori di media e deviazione standard del campione, ed s. E’ però possibile valutare.
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
La statistica F Permette di confrontare due varianze, per stabilire se sono o no uguali. Simile al valore t di Student o al chi quadrato, l’F di Fisher.
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Test basati su due campioni Test Chi - quadro
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
“Teoria e metodi della ricerca sociale e organizzativa”
Intervalli di confidenza
La distribuzione campionaria della media
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Dalmine, 26 Maggio 2004 Esercitazioni di Statistica con Matlab Dott. Orietta Nicolis fttp:\ingegneria.unibg.it.
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
1111 Università di Napoli Federico II, Dipartimento di Scienze Economiche e Statistiche S. BalbiI test non parametrici.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
Transcript della presentazione:

Cap. 19 Test statistici Cioè come verificare ipotesi statistiche utilizzando i dati campionari

Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro L’obiettivo è invece utilizzare dati campionari per stabilire se un’ipotesi, qualche che essa sia, possa essere «ragionevolmente» accettata o rifiutata (in termini probabilistici). L’ipotesi statistica è una congettura riguardante una qualche caratteristica (statistica) del fenomeno in U Tale congettura è formulata a priori, ovvero prima di estrarre il campione L’ipotesi può essere parametrica, quando riguarda il valore di un parametro (la media, la varianza…) di U, oppure non parametrica, ad esempio l’esistenza o meno di relazione statistica in una coppia di fenomeni congiuntamente osservati sulla stessa U, oppure riguardo al tipo di v.c. adatta a interpretare il fenomeno in U … L’ipotesi sottoposta a test si chiama ipotesi nulla (H0).

La verifica di ipotesi (statistiche) è la metodologia inferenziale che a partire dai dati campionari porta a decidere se accettare o rifiutare l’ipotesi nulla H0 controllando probabilisticamente l’errore campionario. Il test statistico è la regola pratica che porta a questa decisione.

Errore campionario Un test statistico, cioè la regola che porta ad accettare o rifiutare H0, è basato sui dati campionari, cioè su una osservazione parziale dell’intera U di riferimento. E’ dunque condotto in condizioni di incertezza: quando il test porta al rifiuto di H0 questo non significa necessariamente “H0 falsa” ma solo che “i dati campionari non suffragano sufficientemente H0”. Quando invece il test porta all’accettazione di H0 questo non significa necessariamente “H0 vera” ma soltanto che “i dati campionari sono consistenti e supportano H0”. Accettare o rifiutare H0 sulla base dei dati campionari comporta inevitabilmente il rischio di commettere un errore. Errore di I specie: rifiutare H0 quando H0 è vera. Errore di II specie: accettare H0 quando H0 è falsa.

Livello di significatività Il livello di significatività, ovvero la probabilità dell’errore di I specie che si è disposti a tollerare, è scelto a piacere Però, minore è la probabilità dell’errore di I specie (a) che si è disposti a tollerare, maggiore è la probabilità dell’errore di II specie (b) che si è costretti a subire. L’ideale sarebbe avere dei dati che identifichino con grande precisione la correttezza della nostra ipotesi statistica, ovvero tali per cui anche fissando una piccola probabilità dell’errore di I specie (a) si abbia una piccola probabilità dell’errore di II specie (b), ovvero un valore grande di 1- b (che viene chiamato potenza del test statistico). Generalmente il livello di significatività è fissato al 90%, 95% o 99%

Z-test per la verifica di ipotesi su m popolazione normale, s2 nota Si calcola la stima puntuale per m, cioè la media del campione: Se H0 è vera, dovrebbe essere piccola

Z-test per la verifica di ipotesi su m popolazione normale, s2 nota Con le probabilità scelte a e (1- a) si divide la probabilità (area) sotto la curva a campana della statistica test Z in due zone: una zona di valori a favore dell’accettazione di H0. Sono i valori intorno allo 0, con probabilità pari a (1- a) - zona di accettazione una zona di valori che depongono per il rifiuto di H0. Sono i valori lontani da 0 (in + e in -) cioè quelli corrispondenti alle due code della campana. Sotto ciascuna coda si divide la probabilità residua a equamente in a/2 e a/2 – zona di rifiuto o zona critica. Test: si rifiuta H0 a livello (1- a) se il valore sperimentale cade nella regione critica, individuata dal valore Z-score za/2

Z-test per la verifica di ipotesi su m popolazione normale, s2 ignota Al posto di s2 utilizziamo la sua stima: La statistica test che si ottiene non è più distribuita come una normale standard Z ma come una T di Student con n-1 gradi di libertà: Per ottenere il valore critico del test bisogna guardare sulle tavole il T-score ta/2

Test approssimati per grandi campioni in mancanza di informazioni ausiliarie a priori sulla normalità della popolazione è necessario compensare con una quantità di dati campionari sufficientemente grande.

Z-test per la verifica di ipotesi sulla frequenza relativa p, grandi campioni

Verifica dell’ipotesi di indipendenza statistica tra due variabili X e Y Quando si dispone di dati completi, cioè in ambito descrittivo, si ha se e soltanto se X e Y sono statisticamente indipendenti. Con dati campionari l’indice può essere diverso da 0 anche se X e Y sono statisticamente indipendenti, a causa dell’errore campionario.

Verifica dell’ipotesi di indipendenza statistica tra due variabili X e Y Un teorema di teoria delle probabilità garantisce che per n sufficientemente grande (e, come al solito, sotto H0) la statistica test c2 è approssimativamente una v.c. chiamata (anche lei!) Chi quadrato con gradi di libertà (k-1)(h-1), dove k è il numero di righe e h è il numero di colonne della tabella di contingenza, cioè dei dati campionari.

Test Chi quadrato di indipendenza statistica Il valore sperimentale coincide in questo caso con la stima puntuale del c2 Questo valore va confrontato con il valore critico riportato nelle tavole, per i relativi gradi di libertà