Inferenza su proporzioni

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
8) GLI INTERVALLI DI CONFIDENZA
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
I TEST DI SIGNIFICATIVITA' IL TEST DI STUDENT
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI
Intervalli di confidenza
Confronto tra 2 campioni Nella pratica è utilissimo confrontare se 2 campioni provengono da popolazioni con la stessa media: Confronti tra produzioni di.
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Lez. 3 - Gli Indici di VARIABILITA’
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
Corso di Calcolo delle Probabilità e Statistica II Parte – STATISTICA
Inferenza statistica per un singolo campione
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
intervallo di confidenza e test di significatività per una proporzione
DALL'INTERVALLO DI PROBABILITÀ
DIFFERENZA TRA LE MEDIE
Analisi della varianza (a una via)
Le analisi per singolo item
1 Introduzione alla statistica per la ricerca Lezione III Dr. Stefano Guidi Siena, 18 Ottobre 2012.
Distribuzioni di probabilità
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 9: test di Student
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 7-2: Test di significatività
Corso di biomatematica lezione 7: Test di significatività
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a LA STATISTICA INFERENZIALE
Esercizi x1=m-ts x2=m+ts
Lezione 7 i Test statistici
Da studi svolti negli anni ‘50 è emerso che il numero ideale di figli per famiglia è di 3. Nel 1980, ipotizzando una modifica nei costumi e nei modelli.
Analisi della varianza
Il test di ipotesi Cuore della statistica inferenziale!
Verifica delle ipotesi su due campioni di osservazioni
METODI E CONTROLLI STATISTICI DI PROCESSO
Statistica Descrittiva
Le distribuzioni campionarie
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Corso di biomatematica lezione 7-3: Test di significatività
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Il test del Chi-quadrato
Intervalli di fiducia.
Anova a due fattori Esempio di piano fattoriale: il caso della progettazione robusta di batterie Tipo di Materiale Temperatura (°F)
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Corso di Analisi Statistica per le Imprese
“Teoria e metodi della ricerca sociale e organizzativa”
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Test basati su due campioni Test Chi - quadro
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
Intervalli di confidenza
La distribuzione campionaria della media
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
Accademia europea dei pazienti sull'innovazione terapeutica Lo scopo e i fondamenti della statistica negli studi clinici.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
INTRODUZIONE ALL’ANALISI DELLA VARIANZA
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Implementazione.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

Inferenza su proporzioni Sinossi

Correzione per continuità con la distribuzione binomiale: determinare la probabilità di due o meno di otto o più successi quando n=10 e π= 0.5

uso della distribuzione binomiale Qui non riportate ; Confronto di Metodo Tabelle statistiche 1 proporzione Esatto uso della distribuzione binomiale Qui non riportate ; si calcolano a mano Approx approssimazione normale alla distribuzione binomiale con correzio­ne per la continuità Aree sottese alla curva normale chi-quadrato con 1 g.l. e correzione per continuità (Nota: i metodi 2 e 3 sono algebricamente identici) Chi-quadrato con 1 g.l. 2 proporzioni in campioni indipendenti test esatto di Fisher Approssimato rapporto critico di differenza tra le proporzioni (con correzione per la continuità) relativo all'errore standard della differenza Approssimato: chi-quadrato con 1 g.l. e correzione di Yates per continuità (Nota: i metodi 2 e 3 sono algebricamente identici) in campioni appaiati Test di Mc Nemar Il metodo si basa sulla eliminazione delle coppie con risposte congiunte ed analizza soltanto le coppie con risposte disgiunte Non riportate isi calcolano a mano Distribuzione binomiale esatta con p=1/2 approssimazione normale alla binomiale con -p=1/2 e correzione per la continuità chi-quadrato con 1 g.l. e correzione per la continuità (Nota: i metodi 2 e 3 sono alge­bricamente identici) proporzioni in campioni indipendenti chi-quadrato con k - 1 g.l. dove k denota il numero di proporzioni campionarie Chi-quadrato con k-1 g.l. più di 2 proporzioni Non riportato

Teorema del limite centrale p è una media ; p = r = Varianza (p) = Varianza (r) = Errore standar di (p) = Errore standard(r) = La curva normale si applica per

RIASSUNTO DEI RISULTATI DI UNA DISTRIBUZIONE BINOMIALE (Tab5.1) Risultato osservato campione di n repliche Media della popolazione Errore standard Coda di sinistra Coda di destra Numero di successi Proporzione di successi

LIMITI DI CONFIDENZA DI UNA PROPORZIONE   Consideriamo una % osservata del 56% di polmonite atipica in un campione di 25 soggetti. Abbiamo un intervallo di confidenza al 95% nella popolazione sottostante per la proporzione di polmonite atipica pari a = 0.560,195 = (da 0.365 a 0.755)

DETERMINAZIONE DELLA DIMENSIONE DEL CAMPIONE risolvendo per n ed eliminando p

CONFRONTO DI PROPORZIONI Campione Gruppo sottoposto a trattamento Gruppo di controllo Totale POPOLAZIONE Proporzione di successi CAMPIONE Dimensione del campione Numero di successi =( + )/ ( + ) + + = = / /

TEST D’IPOTESI s.e.( - ) poniamo = ( + )/( + ) quindi

Altre caratteristiche dei test di significatività Usando l'approssimazione normale alla binomiale, si può rispondere ad altri quesiti riguardanti i test di significatività che implicano l'uso inverso delle formule date nella tabella [1]. Ad esempio, specificando il livello di significatività e l'ipotesi nulla si può determinare il numero di successi che sono necessari per ottenere la significatività statistica.

Esempio 3. Si consideri una prova di due analgesici, A e B, condotta in modo simile a quella descritta precedentemente, ma con la partecipazione prevista di un centinaio di pazienti affetti da emicrania cronica. Se il ricercatore saggia l'ipotesi nulla che gli analgesici siano ugualmente preferibili ed usa un test a due code al livello del 5%, quante preferenze deve osservare, per ciascuno dei due farmaci, per rifiutare l'ipotesi nulla? Come precedentemente, =pr(preferenze per A) e l'ipotesi nulla afferma che  = ½. Dal momento che n = n(1 - )= (100) (½) = 50, che è ben più di 5, si può usare la distribuzione normale. Il test a due code a livello del 5% significa il 5% nelle due code della distribuzione normale, precisamente i valori di z pari a +1.96 e -1.96. II rapporto critico per il «numero di successi» nella [1] dà, nella coda di destra, Risolvendo per x si ha:x = (l.96) (5) + 50 + 0.5 = 60.3. Nella coda di sinistra z = -1.96 comporta x =(-1.96)(5)+50 - 0.5 = 39.7 . Fin qui gli esempi numerici hanno comportato  =(½); Naturalmente può non essere così e l'interesse può accentrarsi sulla verifica di ipotesi che implicano valori di  diversi da (½).

Esempio [4]. Nelle truppe degli Stati Uniti residenti in una base aerea in Italia meridionale verso la fine della seconda Guerra Mondiale, ci fu un'epidemia di polmonite ati-pica nella quale il 40% di parecchie centinaia di uomini di uno squadrone con-trassero la malattia. Durante la ricerca su questa epidemia, i tassi di attacco della malattia furono calcolati in accordo ai diversi ruoli che questi soldati rico-privano nella base. In un caso, 14 (cioè il 56%) dei 25 uomini appartenenti all'equipaggio addetto a terra alle comunicazioni, contrassero la malattia. Esiste evidenza che tale equipaggio abbia avuto un tasso di attacco più alto dell'intero squadrone? Considerando che il tasso di attacco totale fu del 40%, l'attacco osservato del 56% fra questi 25 uomini fu qualcosa di eccezionale? Oppure questo tasso di attacco campionario potrebbe essersi verificato puramente per caso? Si consideri un test di significatività con questi dati. L'ipotesi nulla stabilisce che l'equipaggio addetto a terra alle comunicazioni eb-be lo stesso tasso d'attacco della rimanente popolazione, precisamente, =0.4. Se l'ipotesi nulla di un tasso di attacco della popolazione del 40% è vera, quale è la probabilità di trovare in un campione di 25 unità un tasso di attacco del 56% o maggiore

Esempio [4]. Si supponga che quella del 5% sia giudicata una probabilità abbastanza bassa e che l'interesse si accentri su un test a due code. (Quest'ultima specificazione indica che il ricercatore, prima di esaminare i suoi dati campionari, è parimenti interessato tanto alla possibilità che l'equipaggio addetto a terra alle comunicazioni abbia avuto un tasso d'attacco più alto dell'intero squadrone, quanto che l'abbia avuto più basso. Si può facilmente vedere che sono soddisfatte le condizioni per l'applicazione della distribuzione normale, come approssimazione alla binomiale, precisamente L'uso del rapporto critico per le percentuali [1] dà: Dalle tabelle a due code della distribuzione normale, la probabilità richiesta è 0.153, Cosi il tasso osservato nel campione si può ben spiegare con una variazione casuale o di campionamento. Quindi il tasso d’attacco dell'equipaggio addetto a terra alle comunicazioni è compatibile con quello dell'intero squadrone (P > 0.05).

Esempio 5 (terapia farmacologica nell’IMA) La fornisce un'illustrazione ideale per il confronto di proporzioni indipendenti. Questi dati si riferiscono ad una sperimentazione clinica del propranololo su pazienti affetti da infarto miocardico. I due gruppi di pazienti sono quelli trattati con propranololo e un gruppo di controllo che non riceve il farmaco. La risposta dicotomica consisteva nell'essere ciascun paziente ancora vivo al ventottesimo giorno dopo la sua ammissione allo studio. o nell'essere egli venuto a mancare in un certo momento compreso entro questo periodo di 28 giorni. Sono riprodotti qui sotto i dati relativi, insieme con i tassi di sopravvivenza, in ciascuno Risposta Trattato propranololo % trattato placebo Totale Sopravvissuti 28 giorni 38 (84.4%) 29 (63.0%) 67 Non sopravvissuti 7 17 24 45 46 91 (73.6%)

Esempio 5 (terapia farmacologica nell’IMA) Questi risultati campionari forniscono sufficiente evidenza che il propranololo aumenta il tasso di sopravvivenza nei 28 giorni se confrontato con un controllo? Se di fatto non ci fosse differenza nei tassi di sopravvivenza tra la sottostante popolazione dei trattati con propranololo e la popolazione di controllo, e verosimile che con i campioni di cui sopra si possa osservare uno scarto uguale o maggiore a quello osservato, puramente per caso? Si supponga di adottare il livello di significatività del 5% e di desiderare un test a due code.

Risposta: In primo luogo, e così appropriata usare il test basato sulla distribuzione normale? Chiaramente p = 67/91 = 0.7363, e q = 1- p = 0.2637. Dal momento che nT = 45 e nC = 46, si può vedere che nT p , nT q, nC p ed nC q saranno certamente più alti di 5. Allora si può usare con sicurezza il test basato sulla distribuzione normale. Dal momento che il tasso di sopravvivenza del gruppo trattato con propranololo è maggiore di quello del gruppo di controllo, il rapporto critico con la correzio-ne per la continuità diviene: Le tabelle a due code della distribuzione normale danno una probabilità di 0.038. La conclusione e che i pazienti trattati con propranololo hanno un tasso di sopravviven-za a 28 giorni significativamente maggiore di quello del gruppo di controllo non trattato col propranololo (P<0.05). In altre parole la differenza osservata nei tassi di sopravviven-za non può spiegarsi come effetto del caso o della fluttuazione di campionamento.