La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Cap. 19 Test statistici Cioè come verificare ipotesi statistiche utilizzando i dati campionari 1.

Presentazioni simili


Presentazione sul tema: "Cap. 19 Test statistici Cioè come verificare ipotesi statistiche utilizzando i dati campionari 1."— Transcript della presentazione:

1 Cap. 19 Test statistici Cioè come verificare ipotesi statistiche utilizzando i dati campionari 1

2 Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro L’obiettivo è invece utilizzare dati campionari per stabilire se un’ipotesi, qualche che essa sia, possa essere «ragionevolmente» accettata o rifiutata (in termini probabilistici). L’ipotesi statistica è una congettura riguardante una qualche caratteristica (statistica) del fenomeno in U Tale congettura è formulata a priori, ovvero prima di estrarre il campione L’ipotesi può essere parametrica, quando riguarda il valore di un parametro (la media, la varianza…) di U, oppure non parametrica, ad esempio l’esistenza o meno di relazione statistica in una coppia di fenomeni congiuntamente osservati sulla stessa U, oppure riguardo al tipo di v.c. adatta a interpretare il fenomeno in U … L’ipotesi sottoposta a test si chiama ipotesi nulla ( H 0 ). 2

3 La verifica di ipotesi (statistiche) è la metodologia inferenziale che a partire dai dati campionari porta a decidere se accettare o rifiutare l’ipotesi nulla H 0 controllando probabilisticamente l’errore campionario. Il test statistico è la regola pratica che porta a questa decisione. 3

4 Errore campionario Un test statistico, cioè la regola che porta ad accettare o rifiutare H 0, è basato sui dati campionari, cioè su una osservazione parziale dell’intera U di riferimento. E’ dunque condotto in condizioni di incertezza: quando il test porta al rifiuto di H 0 questo non significa necessariamente “ H 0 falsa” ma solo che “i dati campionari non suffragano sufficientemente H 0 ”. Quando invece il test porta all’accettazione di H 0 questo non significa necessariamente “ H 0 vera” ma soltanto che “i dati campionari sono consistenti e supportano H 0 ”. Accettare o rifiutare H 0 sulla base dei dati campionari comporta inevitabilmente il rischio di commettere un errore. Errore di I specie: rifiutare H 0 quando H 0 è vera. Errore di II specie: accettare H 0 quando H 0 è falsa. 4

5 Livello di significatività Il livello di significatività, ovvero la probabilità dell’errore di I specie che si è disposti a tollerare, è scelto a piacere Però, minore è la probabilità dell’errore di I specie (  ) che si è disposti a tollerare, maggiore è la probabilità dell’errore di II specie (  ) che si è costretti a subire. L’ideale sarebbe avere dei dati che identifichino con grande precisione la correttezza della nostra ipotesi statistica, ovvero tali per cui anche fissando una piccola probabilità dell’errore di I specie (  ) si abbia una piccola probabilità dell’errore di II specie (  ), ovvero un valore grande di 1-  (che viene chiamato potenza del test statistico). Generalmente il livello di significatività è fissato al 90%, 95% o 99% 5

6 Z-test per la verifica di ipotesi su  popolazione normale,   nota Si calcola la stima puntuale per , cioè la media del campione: Se   è vera, dovrebbe essere piccola 6

7 Z-test per la verifica di ipotesi su  popolazione normale,   nota Con le probabilità scelte  e  si divide la probabilità (area) sotto la curva a campana della statistica test Z in due zone: 1.una zona di valori a favore dell’accettazione di  . Sono i valori intorno allo 0, con probabilità pari a  zona di accettazione 2.una zona di valori che depongono per il rifiuto di  . Sono i valori lontani da 0 (in  e in  ) cioè quelli corrispondenti alle due code della campana. Sotto ciascuna coda si divide la probabilità residua  equamente in  e  – zona di rifiuto o zona critica. Test: si rifiuta   a livello  se il valore sperimentale cade nella regione critica, individuata dal valore Z-score z  7

8 Z-test per la verifica di ipotesi su  popolazione normale,   ignota Al posto di   utilizziamo la sua stima: La statistica test che si ottiene non è più distribuita come una normale standard Z ma come una T di Student con n  gradi di libertà: Per ottenere il valore critico del test bisogna guardare sulle tavole il T- score t  8

9 Test approssimati per grandi campioni in mancanza di informazioni ausiliarie a priori sulla normalità della popolazione è necessario compensare con una quantità di dati campionari sufficientemente grande. 9

10 Z-test per la verifica di ipotesi sulla frequenza relativa p, grandi campioni 10

11 Verifica dell’ipotesi di indipendenza statistica tra due variabili X e Y Quando si dispone di dati completi, cioè in ambito descrittivo, si ha se e soltanto se X e Y sono statisticamente indipendenti. Con dati campionari l’indice può essere diverso da 0 anche se X e Y sono statisticamente indipendenti, a causa dell’errore campionario. 11

12 Verifica dell’ipotesi di indipendenza statistica tra due variabili X e Y Un teorema di teoria delle probabilità garantisce che per n sufficientemente grande (e, come al solito, sotto   ) la statistica test   è approssimativamente una v.c. chiamata (anche lei!) Chi quadrato con gradi di libertà  k  h , dove k è il numero di righe e h è il numero di colonne della tabella di contingenza, cioè dei dati campionari. 12

13 Test Chi quadrato di indipendenza statistica Il valore sperimentale coincide in questo caso con la stima puntuale del   Questo valore va confrontato con il valore critico riportato nelle tavole, per i relativi gradi di libertà 13


Scaricare ppt "Cap. 19 Test statistici Cioè come verificare ipotesi statistiche utilizzando i dati campionari 1."

Presentazioni simili


Annunci Google