intervallo di confidenza e test di significatività per una proporzione Per campioni di sufficiente numerosità (n), la distribuzione di una propor-zione p approssima la gaussiana: l'approssimazione è ritenuta buona se il valore più piccolo tra np e n(1-p) è maggiore di 5. Dove p è la proporzione di “esiti favorevoli”. p N(p,p(1-p)/n)1/2 L'espressione dell'intervallo di confidenza di , in base a tale appros-simazione, sarà semplicemente: I.C.(1-a)() = p za/2 ES(p) es(p) =[p(1-p)/n]1/2 E per saggiare l’ipotesi nulla H0 : pp0 si può ricorre al calcolo della deviata gaussiana standardizzata
precisamente le cui radici sono: dove: ATTENZIONE: Si noti che la varianza della proporzione campionaria (p) dipende dall'ignoto parametro (proporzione vera p) di cui p è stima. I limiti di confidenza approssimati si trovano come soluzioni dell’equazione di secondo grado in che si ricava da: precisamente le cui radici sono: dove: Quando si usa il test di significatività invece, nella formula dell’errore standard compare il valore p0 fissato nell’ipotesi nulla.
ESEMPIO: In una sperimentazione clinica controllata si vuole valutare l’efficacia di due analgesici, A e B. Di 80 pazienti, 40 selezionati a caso sono trattati in una settimana con il farmaco A e in quella successiva con il B (sequenza A_B) mentre i rimanenti 40 ricevono i farmaci nella sequenza B_A. A ciascun paziente si richiede di esprimere la propria preferenza per uno o per l’altro dei due farmaci. Degli n=80 pazienti, 52 preferiscono l’analgesico A cui corrisponde p = 0.65. Dai dati di questo esempio si ricava che l’intervallo di confidenza di , al 99%, risulta : dove: a=2.57²/80 = 0.08256 L’ipotesi nulla: stessa efficacia dei due farmaci, è H0 : 0 = 0.50 e il test è a due code.
test di significatività per la differenza tra due proporzioni Una sperimentazione clinica di Limet et al. (1987). Obiettivo: valutare l’effetto di un farmaco X nel ridurre la frequenza di occlusione del trapianto venoso (graft) che si inserisce nel baypass aortocoronarico, a dieci giorni dall’intervento chirurgico, Risultato: su 240 trapianti in pazienti trattati con il farmaco vi erano 17 occlusioni, e su 232 trapianti in pazienti trattati con placebo vi erano 31 occlusioni. Svolgimento della ricerca: Indichiamo con pF e pP le probabilità di occlusione nelle popolazioni di tutti i possibili pazienti trattati con Farmaco e Palcebo. Le due proporzioni: pF = 17/240 = 0.07083 e pP = 31/232 = 0.13362 sono stime puntuali di pF e pP rispettivamente.
sca var = p1*(1-p1)/n1+p2*(1-p2)/n2 Poiché scopo della sperimentazione clinica era di valutare la riduzione nella frequenza di occlusione ottenuta con il farmaco, l’ipotesi nulla da saggiare in questo studio è: H0: pF=pP (i trattamenti F e P hanno uguale efficacia) Var(pF-pP) = pP (1-pP)/n1 + pF (1-pF)/n2 z(pF-pP) = (pF-pP) / [pP (1-pP)/n1 + pF (1-pF)/n2]1/2 sca p1 = 17/240 sca n1 = 240 sca p2 = 31/232 sca n2 = 232 sca var = p1*(1-p1)/n1+p2*(1-p2)/n2 sca z=(p1-p2)/sqrt(p1*(1-p1)/n1+p2*(1-p2)/n2) sca p = norm(-abs(z))*2 sca list p1 p2 n1 n2 var z p p1 = .07083 p2 = .13362 n1 = 240 n2 = 232 var = .00077321 z = -2.2580906 p = .02394001 Conclusioni: p<0.05 quindi rifiuto l’ipotesi nulla
Tabelle di contingenza I risultati della sperimentazione sull’effetto del farmaco e del placebo possono essere descritti in una tabella in cui si incrociano i criteri di classificazione farmaco o placebo (F o P) ed esito della terapia (successo o insuccesso): in ogni cella risultante da tale incrocio si riporta la frequenza osservata (fi ) di soggetti che hanno entrambe le caratteristiche che identificano la cella (ad es. il numero di pazienti, trattati con il farmaco, in cui la terapia ha avuto successo).
Una tabella siffatta prende nome di tabella di contingenza: occlusioni P F Totale SI 48 NO 424 232 240 472 Se si assume la veridicità di H0, la stima della probabilità di occlusione fornita in base alla totalità dei dati, è: p = 48/472 = 0.10169 quindi:E(a) = 0.10169×232 = 23.593 24 Data la frequenza con cui si verifica l’evento (occlusione) sotto H0 e data la dimensione (relativamente) elevata dei campioni ci si può ancora avvalere dell’approssimazione gaussiana.
test di significatività In questo caso a è l’area sottesa alla coda della distribuzione gaussiana alla destra del valore assunto dalla deviata gaussiana standardizzata: occlusioni P F Totale SI a n2 NO n1 m1 m2 T dove: ES(a)= Con i dati dello studio di Limet et al. (1987) si ha: cui corrisponde =0.01786 e quindi il rifiuto di H0 se si è scelta la soglia di significatività del 5%.
intervallo di confidenza per la differenza tra due proporzioni (1) A questo punto è d’uopo completare l’analisi calcolando l’intervallo di confidenza della riduzione nella frequenza di occlusione: = P - F Stima puntuale di questo parametro è la differenza osservata: d = pP – pF = 0.13362 – 0.07083 = 0.06279 Ricordiamo che la varianza di una differenza di due variabili indipendenti è uguale alla somma delle loro due varianze. Dato che: Var(pP) = pP (1-pP)/m1 Var(pF) = pF (1-pF)/m2 la varianza della differenza è: Var(d) = pP (1-pP)/m1 + pF (1-pF)/m2 Se P e F sono ignoti e si dispone solo delle loro stime puntuali, la varianza di d può essere così stimata: Var(d) = pP (1-pP)/(m1-1) + pF (1-pF)/(m2-1)
Ora adottando ancora una volta l’approssimazione gaussiana l’intervallo di confidenza al 100(1-)% è dato da: d z(1-/2)ES(d) Così con i dati di Limet et al. (1987) si calcola il seguente intervallo di confidenza al 95%: = 0.00818 ; 0.11741 Si può ora concludere che il trattamento farmacologico riduce, rispetto al placebo, la frequenza di occlusione in modo statisticamente significativo; la percentuale di riduzione è compresa tra un minimo di circa l’1% e un massimo di circa il 12%.