La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)

Presentazioni simili


Presentazione sul tema: "INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)"— Transcript della presentazione:

1 INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
Si vuole stimare la sensibilità () di un test diagnostico, in modo tale che l'intervallo di confidenza al 90% abbia ampiezza non superiore a  0.03. Come possiamo fare? Già sappiamo che, per campioni di sufficiente numerosità (n), la distribuzione di una proporzione approssima la gaussiana (l'appros-simazione è ritenuta buona se il valore più piccolo tra n e n(1-) è maggiore di 5): p  N(, (1-)/n) L'espressione dell'intervallo di confidenza di , in base a tale approssimazione, sarà: I.C.1-= p  z/2((1-)/n)1/2

2 INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (2)
Da questa si può ricavare la dimensione del campione che garantisce all'intervallo un'ampiezza pari a 2: = z/2((1-)/n)1/2 n= (1-)(z/2/)2 Si noti che la varianza della proporzione campionaria (p) dipende dall'ignoto parametro (proporzione vera ) di cui p è stima. Per calcolare la dimensione del campione sarà quindi necessario avere una qualche idea del valore di .

3 INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (3)
Supponiamo di sapere, nel nostro esempio, che la vera sensibilità () del test diagnostico in esame è sicuramente maggiore di 0.9. Se ci basiamo su tale valore per calcolare la dimensione del campione ricaviamo che: Si noti che tale dimensione è stata calcolata per eccesso, poiché la vera sensibilità del test è sicuramente maggiore: ad esempio, se  fosse pari a 0.95, la numerosità necessaria sarebbe 0.95  0.05  2988  145.

4 INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (4)
Tra i 270 soggetti affetti da malattia sottoposti al test diagnostico, si sono osservati 254 esiti positivi: la sensibilità stimata è quindi p = 254/270 =  L'intervallo di confidenza può essere calcolato direttamente dall'espressione fornita dopo avere sostituito p a : I.C.90% = 0.941  1.64   = 0.941  0.024 = [0.917; 0.965] Posso pertanto affermare che la vera sensibilità () del test diagnostico è un qualunque valore incluso tra e La probabilità che tale affermazione corrisponda a verità vale circa il 90%.

5 TEST D'IPOTESI SU UNA PROPORZIONE (1)
Supponiamo di voler saggiare se la vera sensibilità () del test diagnostico in esame, è davvero pari a 0=0.95, così come dichiarato dal produttore del test, oppure ha un valore inferiore. Si tratta di scegliere tra le due ipotesi: H0 :  = 0 (la vera sensibilità del test è pari a 0=0.95) H1 :  < 0 (la vera sensibilità del test è minore di 0=0.95) Supponiamo di scegliere il livello ==0.05 per i rischi di errore di tipo I e II, e che la minima sensibilità accetta­bile per il test diagnostico sia 1=0.90 ( = 0 - 1 = 0.05).

6 Per il calcolo della dimensione del campione, si procede in maniera analoga a quanto visto per il test su una media. La soglia p* che discrimina tra le due ipotesi a confronto può essere espressa sia rispetto al valore di  sotto H0 sia rispetto al valore di  specificato sotto H1 Si ricava pertanto che:

7 TEST D'IPOTESI SU UNA PROPORZIONE (2)
Se 0 e 1 non sono molto diverse, l'espressione per il calcolo della dimen-sione del campione assume una forma analoga a quella già vista per il test sulla media: dove  vale 0 quando 0  (1- 0) >  1(1- 1), e vale 1 viceversa. Si ha un'approssimazione migliore se si pone  = (0 +  1)/2. Nel nostro esempio, poiché z = z = 1.64, con la forma non-approssimata si ottiene n=(1.64 [0.950.05]1/2+1.64[0.900.10]1/2)2/0.052 = ( )2/ 0.052   290

8 Nel caso che si usi la forma approssimata, la dimensione del campione risulta sovrastimata se si pone  = 1: n = ( )2  (0.90  0.10) / 0.052   390 Se si pone invece  = (0 + 1)/2 = (0.95 + 0.90)/2 = 0.975, l'approssimazione è soddisfacente: n = (1.64 + 1.64)2  (0.925  0.075) / 0.052  300

9 Poiché, come visto, sotto ipotesi nulla la proporzione p stimata da un campione ha distribuzione che approssima una gaussiana con valore atteso 0 e varianza 0 (1 - 0)/n, p N ( 0 , 0  (1 - 0) / n ) il rapporto è una deviata gaussiana standard.

10 Nel nostro esempio, tra i 290 soggetti affetti da malattia sottoposti al test diagnostico, si sono osservati 272 esiti positivi. Pertanto, la proporzione p = 272/290 = 0.938 è una stima dell'ignota sensibilità vera del test diagnostico: Poiché il valore calcolato della statistica z è minore, in valore assoluto, del 5° percentile della deviata gaussiana standard (1.64), accetto, come plausibile, l'ipotesi nulla che la sensibilità vera del test sia pari a 0.95 Si noti che l'errore standard per il test (calcolato sotto H0 ) è diverso da quello usato per il calcolo dell'intervallo di confidenza (che prescinde da H0 ).

11 Test d’ipotesi per la differenza tra due proporzioni (1)
Si vuole saggiare se due farmaci antiepilettici (A e B) hanno differente efficacia nel trattamento dell'epilessia parziale sintomatica. Come indice di efficacia si adotta la proporzione di pazienti che, dopo un mese dall'inizio della terapia, hanno ridotto almeno della metà la frequenza delle crisi. Se si indica con A e B la vera efficacia dei trattamenti A e B, si tratta di scegliere tra le due ipotesi: H0: A =B = (i farmaci A e B hanno uguale efficacia) H1: A B (i farmaci A e B hanno diversa efficacia)

12 Si supponga di prefissare i livelli =0. 05 e =0
Si supponga di prefissare i livelli =0.05 e =0.20 per i rischi di errore di tipo I e II, e che, nella pratica clinica, differenze di efficacia minori del 10% siano trascurabili: ciò equivale a porre  (= |A - B|)= Per quanto concerne il calcolo della dimensione del campione, poiché essa dipende dalla varianza delle proporzioni campionarie (pA e pB) e questa, a sua volta, dipende dai valori della vera efficacia dei farmaci, si dovrà fissare un valore plausibile di efficacia () che, sotto H0, è la stessa per i due farmaci. Ad esempio, poiché | A - B | = 0.10, se un valore plausibile per  è 0.70, ne deriva che i valori di A e B sono 0.65 e 0.75 (o viceversa).

13 La soglia d* che discrimina tra le due ipotesi a confronto può essere espressa in relazione sia ad H0 sia ad H1: Se ci proponiamo di trattare due gruppi di pazienti di uguale numerosità (nA = nB = n), si può ricavare che la dimensione per ciascuno dei due gruppi è: Questa espressione sembra alquanto complicata, tuttavia, se A  B  , si può ottenere una forma analoga a quella vista a proposito del confronto tra medie:

14 Nel nostro esempio, =0. 10, =0. 70, A=0. 65 e B=0
Nel nostro esempio, =0.10, =0.70, A=0.65 e B=0.75, inoltre z/2=1.96 e z=0.84, pertanto la dimensione del campione necessaria è: Allo stesso risultato si perviene con la forma semplificata: Poiché, come visto, sotto ipotesi nulla la differenza tra le proporzioni campionarie pA e pB ha distribuzione che approssima la distribuzione gaussiana e il rapporto è una deviata gaussiana standard.

15 Nella sperimentazione clinica che ci serve da esempio, si sono trattati 330 soggetti per gruppo. Per motivi non dipendenti né dalla comparsa di effetti collaterali né dall' efficacia del farmaco, si sono ritirati dallo studio 18 pazienti trattati con il farmaco A e 24 pazienti trattati con il farmaco B. Sui rimanenti soggetti (soggetti valutabili) si sono calcolati i seguenti indici di efficacia: pA=240/312=0.769 pB =210/306 = 0.686

16 Sotto ipotesi nulla, la stima (p) del parametro di efficacia  comune ai due farmaci è data dal rapporto tra il numero di pazienti in cui la terapia si è rivelata efficace ed il numero totale dei pazienti valutabili: p = ( )/( ) = 450/618 = 0.728 Tale valore sostituisce p nella stima dell'errore standard della differenza (pA-pB) Se ne conclude che l'efficacia del farmaco A è significati­vamente maggiore di quella del farmaco B (p<0.05).

17 Per il calcolo dell'intervallo di confidenza, l'errore stan­dard della differenza tra due proporzioni viene calcolato a prescindere dall'ipotesi nulla: Pertanto, la stima dell'errore standard si ottiene per sostituzione delle propor-zioni campionarie pA e pB ai parametri A e B. Nel nostro esempio, si ha:

18 Si noti che la discrepanza tra questa stima e quella usata per il calcolo della statistica-test è del tutto trascurabile. La discrepanza aumenta al tendere di pA a 0 (o a 1) e di pB a 0.5 o (o viceversa), soprattutto se i due gruppi a confronto non hanno numerosità simile. Nel nostro esempio, fissata la confidenza del 95%, si ha: I.C.95% =  1.96  = [0.013; 0.153]


Scaricare ppt "INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)"

Presentazioni simili


Annunci Google