di cosa si occupa la statistica inferenziale?
Individuazione della popolazione (criteri di inclusione/esclusione) Scelta del campione Valutazione descrittiva del campione Inferenza sulla popolazione Discussione dei risultati
Noi vedremo in modo particolare: stime test
stime Stime puntuali Stime intervallari “Confidence intervals” Cosa significa se leggiamo: c.i. per μ al 95%: (26,4; 30,4) ?
stime Trovare il c.i. al 95%per la stima della media di una popolazione gaussiana N(μ,), avendo a disposizione i dati di un campione, opportunamente scelto, di nume- rosità n, media campionaria m e dev.st. campionaria s. Risulta: q è il quantile … Cosa succede al variare di n, e cosa al variare di s? Con Excel: usare il comando CONFIDENZA
stime E’ possibile calcolare a priori la numerosità del campione in modo da ottenere alla fine un c.i. di lunghezza minore o uguale ad una valore prefissato L? Risulta: Vedi esercizio …
cos’è un test statistico è una “procedura di calcolo” permette di verificare rifiutare un’ipotesi input dati di una campione output un consuntivo decisione in base al consuntivo si rifiuta oppure non si rifiuta l’ipotesi “ipotesi nulla”
cos’è un test statistico logica aristotelica (ipotesi nulla, H0) il nuovo farmaco non è efficace vero falso accetto decisione corretta errore (2° tipo) rifiuto (1° tipo)
cos’è un test statistico (H0) il nuovo farmaco non è efficace vero falso accetto 1 - a P( accetto | falsa ) b, beta rifiuto P( rifiuto | vera) a, alfa 1 - b
test Parole chiave: Ipotesi “nulla” H0 – Ipotesi “alternativa” H1 Significatività del test α – Potenza del test 1-β P-value test: parametrici, non parametrici, … t-Student, 2, Wilcoxon, di normalità, …
indipendenza Completare la seguente tavola: U D M+ 5% M- 95% 40% 60% U D M+ 5% M- 95% 40% 60% 100%
indipendenza Se la malattia non dipende dal genere, possiamo completare la tavola nel modo seguente: U D M+ 2% 3% 5% M- 38% 57% 95% 40% 60% 100%
indipendenza, test 2, test di Fisher tavola attesa tavola osservata U D M+ 8 11 19 4 15 M- 144 217 361 148 213 152 228 380 Risolvere con Excel …
test t di Student casi-controlli per il confronto tra le medie Popolazioni gaussiane N(μ1,σ1), N(μ2,σ2) H0 = {μ1 = μ2}, H1=… Fisso α e β (ad es. 5%, 80%) Scelta del campione, osservazioni sul campione .. da cui ottengo media camp. e SD camp. Con tali valori effettuo il test t Output: p-value – p < α respingo Ho , quindi … p > α non respingo Ho , quindi … Discussione sull’output … e la potenza, dov’è?
test t di Student per il confronto tra le medie Si procede in maniera analoga per confronti tra medie in studi longitudinali (o di coorte) …
il test t di Student
il test t di Student ecco i dati numerici: abbiamo due possibilità:
il p-value è la probabilità di “prendere una cantonata” nel rifiutare l’ipotesi H0 cosa facciamo in questo caso??
test non parametrici per il confronto tra le mediane E se le popolazioni di partenza non sono gaussiane? … test di Mann-Withney (dei ranghi), test di Wilcoxon (dei ranghi con segno) …