La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

1 CORSO DI STATISTICA Bruno Mario Cesana Stefano Calza Nozioni di Calcolo della Probabilità TERZA PARTE.

Presentazioni simili


Presentazione sul tema: "1 CORSO DI STATISTICA Bruno Mario Cesana Stefano Calza Nozioni di Calcolo della Probabilità TERZA PARTE."— Transcript della presentazione:

1 1 CORSO DI STATISTICA Bruno Mario Cesana Stefano Calza Nozioni di Calcolo della Probabilità TERZA PARTE

2 2 UN TEST DIAGNOSTICO (1) Malato (M) Sano (S)Totale Test + (Positivo) A (80) B ( 50) A + B ( 130) Test – (Negativo) C (20) D (850) C + D ( 870) TotaleA + C (100) B + D (900) N (1000) A = VERI POSITIVI, B = FALSI POSITIVI C = FALSI NEGATIVI, D = VERI NEGATIVI

3 3 UN TEST DIAGNOSTICO (2) Evento: (T+ M) P (T+ M) = A / (A + C) = SENSIBILITA Evento: (T - S) P (T - S) = D / (B + D) = SPECIFICITA Evento: (T+ S) Falsi Positivi (1 – Specificità) Evento: (T - M) Falsi Negativi (1 – Sensibilità) Probabilità CONDIZIONATA di ottenere un TEST POSITIVO (T+) DATO CHE IL SOGGETTO E MALATO (M): Probabilità CONDIZIONATA di ottenere un TEST POSITIVO (T+) DATO CHE IL SOGGETTO E SANO (S):

4 4 UN TEST DIAGNOSTICO (3) Ciò che interessa è la probabilità che IL SOGGETTO SIA MALATO DATO un TEST POSITIVO: Probabilità CONDIZIONATA CHE IL SOGGETTO SIA MALATO (M) DATO un TEST POSITIVO (T+) : Il numeratore è ottenuto dallEq.1 Il denominatore [P(T+)] è ottenuto dallEq. 1 e dallEq 2: P(T+)= (T+ M) + (T+ S). QUESTA E LA FORMULA DEL TEOREMA DI BAYES che permette di risolvere il problema dellINFERENZA INVERSA (dal campione alla popolazione).

5 5 UN TEST DIAGNOSTICO (4) VALORE PREDITTIVO POSITIVO (VP+): PROBABILITA CONDIZIONATA CHE IL SOGGETTO SIA MALATO (M) DATO un TEST POSITIVO (T+): VALORE PREDITTIVO NEGATIVO (VP-): PROBABILITA CONDIZIONATA CHE IL SOGGETTO NON SIA MALATO (S) DATO un TEST NEGATIVO (T-):

6 6 TEST DIAGNOSTICO – SCREENING (5)

7 7 UN TEST DIAGNOSTICO (6) Malato (M) Sano (S) Totale Test + (Positivo) A (80) B ( 50) A + B ( 130) Test – (Negativo) C (20) D (850) C + D ( 870) TotaleA + C (100) B + D (900) n (1000) VP+ = A / (A + B ); VP- = D / (C + D) N.B.: FORMULE VALIDE SOLO IN CASO DI UN TEST DI SCREENING: n campione casuale dalla popolazione N.

8 8 CURVE ROC (1)

9 9 CURVE ROC (2)

10 10 SINTOMI (S 1, S 2, S 3 ) E MALATTIE (1) S1S1 S2S2 S3S3 Totale MAL. A100 A S A S A S 3 1,000 [P(A)] MAL. B600 B S 1 1,500 B S B S 3 3,000 [P(B)] MAL. C2,000 C S 1 1,000 C S 2 3,000 C S 3 6,000 [P(C)] Totale2,700 [P(S 1 )] 4,600 [P(S 1 )]10,000 P(A S 1 ) = 100/10,000 = 0.01,…,P(C S 3 )=3,000/10,000 = 0.30 P(S 1 A) = 100/1,000 = 0.10,…, P(S 3 C) = 3,000/6,000 = 0.50 P(A) = 1,000/10,000 = 0.10,…,P(C) = 6,000/10,000 = 0.60 P(S 1 ) = 2,700/10,000 = 0.27,…,P(S 3 ) = 4,600/10,000 = 0.46

11 11 SINTOMI (S 1, S 2, S 3 ) E MALATTIE (2) S1S1 S2S2 S3S3 Totale MAL. A100 A S A S A S 3 1,000 MAL. B600 B S 1 1,500 B S B S 3 3,000 MAL. C2,000 C S 1 1,000 C S 2 3,000 C S 3 6,000 Totale2,700 4,60010,000 P(A S 1 ) = 100/10,000 =0.01,…,P(C S 3 ) = 3,000/10,000 =0.30 P(S 1 A) = P(S 1 A) / P(A) = (100/10,000) / (1,000/10,000) = 100 / 1,000 = P(S 1 B) = P(S 1 B) / P(B) = ( 600/10,000) / (3,000/10,000) = 600 / 3,000 = P(S 1 C) = P(S 1 C) / P(C) = (2,000/10,000) / (6,000/10,000) = 2,000 / 6,000 = 0.33.

12 12 SINTOMI (S 1, S 2, S 3 ) E MALATTIE (3) S1S1 S2S2 S3S3 Totale MAL. A100 A S A S A S 3 1,000 P(A)=0.10 MAL. B600 B S 1 1,500 B S B S 3 3,000 P(B)=0.30 MAL. C2,000 C S 1 1,000 C S 2 3,000 C S 3 6,000 P(C)=0.60 Totale2,700 4,60010,000 P(A S 1 ) = P(S 1 A) / P(S 1 ) = (100/10,000) / (2,700/10,000) = 100 / 2,700 = P(B S 1 ) = P(S 1 B) / P(S 1 ) = ( 600/10,000) / (2,700/10,000) = 600 / 2,700 = P(C S 1 ) = P(S 1 C) / P(S 1 ) = (2,000/10,000) / (2,700/10,000) = 2,000 / 2,700 =

13 13 SINTOMI (S 1, S 2, S 3 ) E MALATTIE (4) S1S1 S2S2 S3S3 Totale MAL. A (M 1 )100 A S A S A S 3 1,000 P(A)=0.10 MAL. B (M 2 )600 B S 1 1,500 B S B S 3 3,000 P(B)=0.30 MAL. C (M 3 )2,000 C S 1 1,000 C S 2 3,000 C S 3 6,000 P(C)=0.60 Totale2,700 4,60010,000 P(A S 1 ) = P(S 1 A) / P(S 1 ) = (100/10,000) / (2,700/10,000) = 100 / 2,700 = P(A S 1 ) = P(S 1 A) / [P(M 1 S 1 ) + P(M 2 S 1 ) + P(M 3 S 1 )] ovvero:

14 14 FORMULA del Teorema di Bayes Dalla formula della probabilità condizionata: P(M i ) = Probabilità a priori (non dipendono dall esito A) P(S 1 | M i ) = Verosimiglianza (la probabilità di A dato che si è verificato E i ) P(M i |S 1 ) = Probabilità a posteriori (verificatosi A, la probabilità con cui E i si verifica) Ma: Quindi:

15 15 Teorema di Bayes Consideriamo linsieme degli eventi E i,, i= 1,2..n tra loro incompatibili che costituiscono lo spazio campione La P(A) sarà data dalla somma delle singole aree di intersezione A E i Considero ora un evento A, sottoinsieme di ovvero: A E1E1 E2E2 E3E EnEn

16 16 Teorema di Bayes (2) Proviamo a pensare agli eventi E i come le cause che determinano levento A. Allora, se si è verificato A, con quale probabilità la causa è E i ? In altre parole: P(E i |A) = ? In tal caso le osservazioni sperimentali (A) forniscono nuove informazioni alle conoscenze a priori (E) [Da dove vengono questultime? Da altri studi, da esperienze personali, ecc.] Come noto: P(E i ) = Probabilità a priori (non dipendono dall esito A) P(A| E i ) = Verosimiglianza (la probabilità di A dato che si è verificato E i ) P(E i |A) = Probabilità a posteriori (verificatosi A, la probabilità con cui E i si verifica) Ma: Quindi:

17 17 Ulteriore esempio E noto che il 2% delle persone controllate dalla polizia è risultato essere in stato debbrezza. Un laboratorio ha messo a punto un alcool-test che ha dato esito positivo nel 95% dei casi di reale ebbrezza (sensibilità) ed esito negativo nel 96% delle persone sobrie (specificità). Quale è la probabilità che una persona sia realmente ebbra, in caso di esito positivo del test (dato che il test è risultato positivo) ? E = evento ubriaco NE = evento non ubriaco T+ = evento test positivo T- = evento test negativo P(E) = 0.02P(NE) = 1 - P(E) = 0.98 P(T+ |E) = 0.95 P(B|E) = 1 - P(T+ |E) = 0.05 P(T- |NE) = 0.96 P(T- |NE) = 1 - P(T- |NE) = 0.04

18 18 Esempio (2) Risulterà: ovvero: Non molto buono! Se aumentassi la specificità: P(T-|NE) = 0.99? Decisamente meglio… ma non certo ottimale !


Scaricare ppt "1 CORSO DI STATISTICA Bruno Mario Cesana Stefano Calza Nozioni di Calcolo della Probabilità TERZA PARTE."

Presentazioni simili


Annunci Google