Statistica e probabilità Università degli Studi di Sassari Facoltà di Medicina veterinaria Corso di Laurea in Medicina veterinaria Anno Accademico 2017/2018 Docente: Dott.ssa Rita Marras
IL TEST DEL CHI-QUADRATO Si utilizza quando si ha a che fare con due variabili entrambe qualitative e si vuole decidere se l’associazione presente fra queste sia o meno significativa. H0: indipendenza; H1: associazione
TEST DEL CHI-QUADRATO La distribuzione del chi-quadrato è asimmetrica, e cambia a seconda dei gradi di libertà:
TEST DEL CHI-QUADRATO Si tratta di sempre di un test a una coda p=p-value o regione di rifiuto
ESEMPIO Sia data la seguente tabella relativa a un test doppio-cieco (farmaco-placebo) su un gruppo di pazienti di una clinica. L’associazione presente tra farmaco e guarigione è significativa? In altre parole, data l’associazione presente nel campione, è possibile concludere che sia così anche nella popolazione, quindi che il farmaco sia realmente efficace? Guariti Staz./pegg. Totali Farmaco 50 30 80 Placebo 40 90 70 160
TAVOLA DELLE FREQUENZE ATTESE Siccome le frequenze attese sono diverse da quelle osservate il farmaco POTREBBE essere efficace. Per verificare la reale efficacia bisogna eseguire un test del chi-quadrato. Si calcola il χ2 tabulato: Guariti Staz./pegg. Totali Farmaco 45 35 80 Placebo 90 70 160
ESEMPIO χ2=(50-45)2/45+(30-35)2/35+(40-45)2/45+ (40-35)2/35=25/45+25/35+25/45+25/35= =10/9+10/7=160/36≈4,44 G.D.L.=(h-1)(k-1)=(2-1)(2-1)=1 Χ20,05;1=3,84 Siccome χ2 tabulato > Χ20,05;1si rifiuta l’ipotesi nulla (il farmaco è efficace).
TAVOLA DEI PERCENTILI
L’ANALISI DELLA VARIANZA (ANOVA) Quando si hanno due variabili, l’una quantitativa e l’altra qualitativa, e si vuole testare la dipendenza delle medie (ovviamente riferite alla variabile quantitativa) nei diversi gruppi (identificati con la variabile qualitativa). In questo caso si parla di ANOVA a una via. Per esempio, si vuole valutare se l’altezza media di un gruppo di donne differisca significativamente da quella degli uomini (quindi se sesso e altezza sono legati, è ovvio che in questo caso lo è), se il livello medio glicemico nel sangue differisca fra le diverse razze umane, etc. H0: μ1= μ2= …= μp; H1: almeno la media di un gruppo differisce
L’ANALISI DELLA VARIANZA (ANOVA) Prima si valuta se nel campione in questione le medie dei gruppi differiscono attraverso l’analisi delle devianze. In caso affermativo si testa se il risultato sia significativo, quindi estrapolabile alla popolazione, tramite un test F di Fisher. E’ possibile creare anche un modello lineare generalizzato, cioè una funzione, che mette in relazione la variabile dipendente (cioè la media) con il gruppo.
ESEMPIO
L’ANALISI DELLA VARIANZA (ANOVA) Il p-value è di poco inferiore a 0,05: la strategia di vendita influisce sul volume delle vendite stesse.