intervallo di confidenza e test di significatività per una proporzione

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
8) GLI INTERVALLI DI CONFIDENZA
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
Intervalli di confidenza
Proprietà degli stimatori
Passo 1: trasformare tutte le percentuali in frequenze (senza sapere la numerosità sulla quale sono state calcolate, non si può fare il confronto tra %)
Confronto tra 2 campioni Nella pratica è utilissimo confrontare se 2 campioni provengono da popolazioni con la stessa media: Confronti tra produzioni di.
Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento.
Analisi dei dati per i disegni ad un fattore
Intervalli di Confidenza
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
STATISTICA A – K (60 ore) Marco Riani
Inferenza statistica per un singolo campione
Valutazione delle ipotesi
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
CONFRONTO TRA DUE MEDIE:
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
Inferenza su proporzioni
DALL'INTERVALLO DI PROBABILITÀ
Esercitazione su test d’ipotesi
Obiettivi del corso di Statistica Medica.
DIFFERENZA TRA LE MEDIE
1 Introduzione alla statistica per la ricerca Lezione III Dr. Stefano Guidi Siena, 18 Ottobre 2012.
Matematica e statistica Versione didascalica: parte 7 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste.
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 9: test di Student
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 4: La funzione di Gauss
Corso di biomatematica lezione 7-2: Test di significatività
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a LA STATISTICA INFERENZIALE
ISTOGRAMMI E DISTRIBUZIONI : i xixi
Valutazione della stima: gli intervalli di confidenza
di cosa si occupa la statistica inferenziale?
Lezione 8 Numerosità del campione
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 7 i Test statistici
Lezione 7 i Test statistici
Verifica delle ipotesi su due campioni di osservazioni
Fondamenti di informatica
Esercitazioni sul calcolo dei valori critici
Le distribuzioni campionarie
Test parametrici I test studiati nelle lezioni precedenti (test- t, test-z) consentono la verifica di ipotesi relative al valore di specifici parametri.
STATISTICA INFERENZIALE
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
IL CAMPIONE.
“Teoria e metodi della ricerca sociale e organizzativa”
Travaglio e parto fisiologico 1
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Test basati su due campioni Test Chi - quadro
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
“Teoria e metodi della ricerca sociale e organizzativa”
Intervalli di confidenza
La distribuzione campionaria della media
Dalmine, 26 Maggio 2004 Esercitazioni di Statistica con Matlab Dott. Orietta Nicolis fttp:\ingegneria.unibg.it.
Accademia europea dei pazienti sull'innovazione terapeutica Lo scopo e i fondamenti della statistica negli studi clinici.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
Introduzione all’inferenza
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
Transcript della presentazione:

intervallo di confidenza e test di significatività per una proporzione Per campioni di sufficiente numerosità (n), la distribuzione di una propor-zione p approssima la gaussiana: l'approssimazione è ritenuta buona se il valore più piccolo tra np e n(1-p) è maggiore di 5. Dove p è la proporzione di “esiti favorevoli”. p  N(p,p(1-p)/n)1/2 L'espressione dell'intervallo di confidenza di , in base a tale appros-simazione, sarà semplicemente: I.C.(1-a)() = p za/2 ES(p) es(p) =[p(1-p)/n]1/2 E per saggiare l’ipotesi nulla H0 :  pp0 si può ricorre al calcolo della deviata gaussiana standardizzata

precisamente le cui radici sono: dove: ATTENZIONE: Si noti che la varianza della proporzione campionaria (p) dipende dall'ignoto parametro (proporzione vera p) di cui p è stima. I limiti di confidenza approssimati si trovano come soluzioni dell’equazione di secondo grado in  che si ricava da: precisamente le cui radici sono: dove: Quando si usa il test di significatività invece, nella formula dell’errore standard compare il valore p0 fissato nell’ipotesi nulla.

ESEMPIO: In una sperimentazione clinica controllata si vuole valutare l’efficacia di due analgesici, A e B. Di 80 pazienti, 40 selezionati a caso sono trattati in una settimana con il farmaco A e in quella successiva con il B (sequenza A_B) mentre i rimanenti 40 ricevono i farmaci nella sequenza B_A. A ciascun paziente si richiede di esprimere la propria preferenza per uno o per l’altro dei due farmaci. Degli n=80 pazienti, 52 preferiscono l’analgesico A cui corrisponde p = 0.65. Dai dati di questo esempio si ricava che l’intervallo di confidenza di , al 99%, risulta : dove: a=2.57²/80 = 0.08256 L’ipotesi nulla: stessa efficacia dei due farmaci, è H0 : 0 = 0.50 e il test è a due code.

test di significatività per la differenza tra due proporzioni Una sperimentazione clinica di Limet et al. (1987). Obiettivo: valutare l’effetto di un farmaco X nel ridurre la frequenza di occlusione del trapianto venoso (graft) che si inserisce nel baypass aortocoronarico, a dieci giorni dall’intervento chirurgico, Risultato: su 240 trapianti in pazienti trattati con il farmaco vi erano 17 occlusioni, e su 232 trapianti in pazienti trattati con placebo vi erano 31 occlusioni. Svolgimento della ricerca: Indichiamo con pF e pP le probabilità di occlusione nelle popolazioni di tutti i possibili pazienti trattati con Farmaco e Palcebo. Le due proporzioni: pF = 17/240 = 0.07083 e pP = 31/232 = 0.13362 sono stime puntuali di pF e pP rispettivamente.

sca var = p1*(1-p1)/n1+p2*(1-p2)/n2 Poiché scopo della sperimentazione clinica era di valutare la riduzione nella frequenza di occlusione ottenuta con il farmaco, l’ipotesi nulla da saggiare in questo studio è: H0: pF=pP (i trattamenti F e P hanno uguale efficacia) Var(pF-pP) = pP (1-pP)/n1 + pF (1-pF)/n2 z(pF-pP) = (pF-pP) / [pP (1-pP)/n1 + pF (1-pF)/n2]1/2 sca p1 = 17/240 sca n1 = 240 sca p2 = 31/232 sca n2 = 232 sca var = p1*(1-p1)/n1+p2*(1-p2)/n2 sca z=(p1-p2)/sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2) sca p = norm(-abs(z))*2 sca list p1 p2 n1 n2 var z p p1 = .07083 p2 = .13362 n1 = 240 n2 = 232 var = .00077321 z = -2.2580906 p = .02394001 Conclusioni: p<0.05 quindi rifiuto l’ipotesi nulla

Tabelle di contingenza I risultati della sperimentazione sull’effetto del farmaco e del placebo possono essere descritti in una tabella in cui si incrociano i criteri di classificazione farmaco o placebo (F o P) ed esito della terapia (successo o insuccesso): in ogni cella risultante da tale incrocio si riporta la frequenza osservata (fi ) di soggetti che hanno entrambe le caratteristiche che identificano la cella (ad es. il numero di pazienti, trattati con il farmaco, in cui la terapia ha avuto successo).

Una tabella siffatta prende nome di tabella di contingenza: occlusioni P F Totale SI   48 NO 424 232 240 472 Se si assume la veridicità di H0, la stima della probabilità di occlusione fornita in base alla totalità dei dati, è: p = 48/472 = 0.10169 quindi:E(a) = 0.10169×232 = 23.593  24 Data la frequenza con cui si verifica l’evento (occlusione) sotto H0 e data la dimensione (relativamente) elevata dei campioni ci si può ancora avvalere dell’approssimazione gaussiana.

test di significatività In questo caso a è l’area sottesa alla coda della distribuzione gaussiana alla destra del valore assunto dalla deviata gaussiana standardizzata: occlusioni P F Totale SI a   n2 NO n1 m1 m2 T dove: ES(a)= Con i dati dello studio di Limet et al. (1987) si ha: cui corrisponde =0.01786 e quindi il rifiuto di H0 se si è scelta la soglia di significatività del 5%.

intervallo di confidenza per la differenza tra due proporzioni (1) A questo punto è d’uopo completare l’analisi calcolando l’intervallo di confidenza della riduzione nella frequenza di occlusione:  = P - F Stima puntuale di questo parametro è la differenza osservata: d = pP – pF = 0.13362 – 0.07083 = 0.06279 Ricordiamo che la varianza di una differenza di due variabili indipendenti è uguale alla somma delle loro due varianze. Dato che: Var(pP) = pP (1-pP)/m1 Var(pF) = pF (1-pF)/m2 la varianza della differenza è: Var(d) = pP (1-pP)/m1 + pF (1-pF)/m2 Se P e F sono ignoti e si dispone solo delle loro stime puntuali, la varianza di d può essere così stimata: Var(d) = pP (1-pP)/(m1-1) + pF (1-pF)/(m2-1)

Ora adottando ancora una volta l’approssimazione gaussiana l’intervallo di confidenza al 100(1-)% è dato da: d  z(1-/2)ES(d) Così con i dati di Limet et al. (1987) si calcola il seguente intervallo di confidenza al 95%: = 0.00818 ; 0.11741 Si può ora concludere che il trattamento farmacologico riduce, rispetto al placebo, la frequenza di occlusione in modo statisticamente significativo; la percentuale di riduzione è compresa tra un minimo di circa l’1% e un massimo di circa il 12%.