PROBABILITA’ E TEST DIAGNOSTICI

Slides:



Advertisements
Presentazioni simili
Dr. Marta Giorgetti Esercizi Calcolo combinatorio, spazio degli eventi, probabilità, indipendenza, teorema di Bayes.
Advertisements

Elementi di calcolo delle probabilità
La probabilità nei giochi
La Matematica tra Gioco e Realtà
8) GLI INTERVALLI DI CONFIDENZA
2. Introduzione alla probabilità
Definizione di probabilità, calcolo combinatorio,
A partire da determinate condizioni iniziali, un esperimento e losservazione del verificarsi di qualche accadimento che, se si ripete lesperimento nelle.
Variabili aleatorie discrete e continue
La probabilità.
Matematica I: Calcolo differenziale, Algebra lineare, Probabilità e statistica Giovanni Naldi, Lorenzo Pareschi, Giacomo Aletti Copyright © The.
Corsi Abilitanti Speciali Classe 59A III semestre - 3
Bruno Mario Cesana Stefano Calza
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Lez. 3 - Gli Indici di VARIABILITA’
Definizioni di probabilità
Definizioni Chiamiamo esperimento aleatorio ogni fenomeno del mondo reale alle cui manifestazioni può essere associata una situazione di incertezza. Esempi:
Elementi di statistica Elementi di statistica M. Dreucci Masterclasses LNF Elementi di statistica M. Dreucci.
3. Processi Stocastici Un processo stocastico è una funzione del tempo i cui valori x(t) ad ogni istante di tempo t sono v.a. Notazione: X : insieme di.
Marco Riani STATISTICA A – K (60 ore) Marco Riani
Esempio Ritorniamo al caso illustrato con i diagrammi di Venn e
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
Campionamento casuale semplice
Obiettivi del corso di Statistica Medica.
Canale A. Prof.Ciapetti AA2003/04
Corso di biomatematica Lezione 2: Probabilità e distribuzioni di probabilità Davide Grandi.
STATISTICA a.a LA STATISTICA INFERENZIALE
Esercizi x1=m-ts x2=m+ts
LA PROBABILITA’.
Corso di Probabilità e Inferenza 1
Impostazione Assiomatica del Calcolo della Probabilità
DEFINIZIONE CLASSICA DI PROBABILITA’
Lezione 4 Probabilità.
Lezione 4 Probabilità.
PROBABILITÀ La probabilità è un giudizio che si assegna ad un evento e che si esprime mediante un numero compreso tra 0 e 1 1 Evento con molta probabilità.
Verifica delle ipotesi su due campioni di osservazioni
METODI E CONTROLLI STATISTICI DI PROCESSO
Esercitazioni sulla Probabilità
Orientamento universitario
La probabilità Schema classico.
Calcolo delle Probabilità
Indici di valutazione di un Test diagnostico
1.PROBABILITÀ A. Federico ENEA; Fondazione Ugo Bordoni Scuola estiva di fonetica forense Soriano al Cimino 17 – 21 settembre 2007.
Lancio dadi Analisi probabilità esito somme varie.
Esempi risolti mediante immagini (e con excel)
Esercizi con soluzione
Torna alla prima pagina Sergio Console Calcolo delle Probabilità seconda parte Istituzioni di Matematiche Scienze Naturali.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
PROBABILITA’.
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.
è … lo studio delle caratteristiche di regolarità dei fenomeni casuali
Calcolo combinatorio e probabilità
Probabilità e Variabili Casuali
Probabilità. Un percorso didattico esperimenti e simulazioni L. Cappello 9 Maggio Didattica probabilità e statistica PAS 2014.
2) PROBABILITA’ La quantificazione della ‘possibilità’ del verificarsi di un evento casuale E è detta probabilità P(E) Definizione classica: P(E) è il.
La variabile casuale (v.c.) è un modello matematico in grado di interpretare gli esperimenti casuali. Infatti gli eventi elementari  che compongono lo.
Spiegazione di alcuni concetti
PROBABILITÀ Corsi Abilitanti Speciali Classe 59A III semestre - 2.
Eventi aleatori Un evento è aleatorio (casuale) quando non si può prevedere con certezza se avverrà o meno I fenomeni (eventi) aleatori sono studiati.
ELEMENTI DI CALCOLO DELLE PROBABILITA’
Elementi di teoria delle probabilità
Elementi di teoria della probabilità e distribuzioni di probabilità.
La probabilità matematica
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
METODI E TECNOLOGIE PER L’INSEGNAMENTO DELLA MATEMATICA Lezione n°17.
ELEMENTI DI CALCOLO DELLE PROBABILITA’. Evento Aleatorio Un evento si dice aleatorio se può o non può verificarsi (Alea in greco vuol dire dado)
1 TEORIA DELLA PROBABILITÁ. 2 Cenni storici i primi approcci alla teoria della probabilità sono della metà del XVII secolo (Pascal, Fermat, Bernoulli)
Probabilità Definizione di probabilità La definizione di probabilità si basa sul concetto di evento, ovvero sul fatto che un determinato esperimento può.
Un evento è un fatto che può accadere o non accadere. Se esso avviene con certezza si dice evento certo, mentre se non può mai accadere si dice evento.
Teoria dei Sistemi di Trasporto Tematica 4: Elementi minimi di teoria della probabilità.
Transcript della presentazione:

PROBABILITA’ E TEST DIAGNOSTICI IL TEST E’ POSITIVO..

In tutti quei casi in cui le manifestazioni di un fenomeno (EVENTI) non possono essere determinate a priori in modo univoco, e i risultati possono essere oggetto di discussione e di valutazioni diverse, la “Probabilità” è strumento “fondamentale”. La “Probabilità” consiste in una valutazione numerica associata alla previsione del un risultato di un esperimento o di una prova, che può dar luogo a diversi risultati (Esperimento Aleatorio)

L’EVENTO E’ L’ELEMENTO DI BASE AL QUALE PUO’ ESSERE APPLICATA UNA PROBABILITA’, ESSO E’ IL RISULTATO DI UN’OSSERVAZIONE O DI UN ESPERIMENTO

Evento certo (S) = (E) + (Ē) SPAZIO DEGLI EVENTI (S): l’insieme di tutti i possibili esiti di un esperimento (serie di prove con esiti non prevedibili) EVENTO (E, F, A..) : è un qualsiasi sottoinsieme (collezione di possibili esiti) dello spazio S. Si dice che un evento si verifica se l’esito dell’esperimento è incluso nella definizione data di evento Evento certo (S) = (E) + (Ē)

Lo spazio degli eventi (S) è composto da tutti i possibili esiti di un esperimento: Eventi semplici Eventi composti (combinazioni di eventi semplici) Evento Certo (S) Evento impossibile (Ø)

S = {(testa, testa), (testa, croce), (croce, testa), (croce, croce)} ES: Risultati possibili nel duplice lancio di una moneta S = {(testa, testa), (testa, croce), (croce, testa), (croce, croce)} E (evento semplice) = {(testa, croce)} E (evento composto) = 1 testa = {(testa, croce), (croce, testa)} Ē = (evento complementare di E) ={(testa, testa), (croce, croce)}

Lancio di un dado: S: Eventi Semplici (A, B, C, D, E, F) : esce 1, esce 2, esce 3, esce 4, esce 5, esce 6 Eventi composti (X, Y): esce un numero pari, esce un numero dispari…. Evento certo: esce un numero da 1 a 6 Evento impossibile: esce 7 S 1 3 4 5 2 6

POSSIBILI OPERAZIONI SU EVENTI L’unione di due eventi A e B (A  B), definita come l’insieme degli esiti che appartengono o all’evento A o all’evento B o simultaneamente ad A e B. L’intersezione di due eventi A e B (AB), definita dall’insieme degli esiti che verificano contemporaneamente A e l’evento B Il complemento di un evento E, indicato con “Ē ” che rappresenta l’evento “non E”, ed è dato da S-E

LO STRUMENTO GRAFICO UTILIZZATO PER RAPPRESENTARE RELAZIONI SEMPLICI E COMPLESSE TRA PIU’ EVENTI E’ IL DIAGRAMMA DI VENN

INTERSEZIONE = INSIEME VUOTO DIAGRAMMA DI VENN A B S A B S Unione Intersezione S In questo caso i 2 eventi si dicono MUTUALMENTE ESCLUSIVI ovvero non possono accadere simultaneamente, gli eventi non hanno esiti in comune INTERSEZIONE = INSIEME VUOTO A Maschio B Femmina

ESERCIZIO Disegnate 3 insiemi tra loro parzialmente sovrapposti (diagramma di Venn) che rappresentino graficamente le seguenti 3 popolazioni: i maschi, coloro che fumano, coloro che hanno un’età compresa tra i 15 e i 20 anni Si definiscano graficamente le seguenti popolazioni: - le femmine fumatrici - coloro che fumano ed hanno tra i 15 e 20 anni M 15/20 Fum

La probabilità P(.) è una misura che associa ad ogni evento “E” un valore numerico “P(E)” che esprime l’incertezza relativa al verificarsi dell’evento P(s) s P(.)

DEFINIZIONI DI PROBABILITA’ Definizioni Classica Definizione Frequentista Definizione Soggettivista

P(A) = m/n =casi favorevoli / casi possibili Definizione Classica Se un esperimento può dar luogo ad n esiti tutti egualmente possibili, e se m di questi esiti hanno l’attributo A, si definisce come probabilità dell’evento A la seguente espressione: P(A) = m/n =casi favorevoli / casi possibili Esempio: Supponiamo di avere un urna con 25 palline colorate, 10 bianche, 7 verdi e 8 rosse: La probabilità di estrarre una pallina bianca sarà 10/25

- L’approccio Classico, o matematico, è il primo che si è affermato, in quanto particolarmente appropriato ai giochi d’azzardo Al di fuori del campo di applicazione dei giochi d’azzardo è difficile trovare situazioni in cui tutti gli esiti di un esperimento casuale possano considerarsi equamente probabili Per esempio, cosa dire dell’esito della somministrazione di un farmaco ad un paziente? Nulla può, a priori, giustificare l’attribuzione ai due possibili esiti dell’esperimento (guarire/non guarire) di un’uguale probabilità. In tali situazioni è possibile associare un valore di probabilità solo provando e riprovando l’esperimento in condizioni costanti.

Definizione Frequentista Se un esperimento è ripetuto n volte in condizioni sostanzialmente identiche, e se A, un suo possibile evento, si verifica m volte, all’aumentare di n, il rapporto m/n si avvicina ad un limite fisso che è la probabilità di A P(A) =lim (m/n) n→∞ !!Si può così ricavare un valore di probabilità come limite cui tende la proporzione di volte in cui l’evento si realizza

Se un esperimento viene ripetuto molte volte la probabilità di un evento, stimata tramite la frequenza relativa, tende ad avvicinarsi alla vera probabilità di quell’evento. In pratica una stima della probabilità basata su poche ripetizioni è INACCURATA, ma via via che il numero di tentativi cresce la stima della probabilità diventa sempre più precisa

Definizione soggettivista Nella realtà scientifica sono inclusi fenomeni che non possono essere ricondotti a condizioni di ripetibilità e equiprobabilità , perché considerati eventi unici o irripetibili. Per questi fenomeni, sia l’approccio classico che quello frequentista falliscono. Per rispondere a domande del tipo: qual è la probabilità che ... - ... avvenga una catastrofe - ... una specie animale o vegetale si estingua Si deve ricorrere alla definizione Soggettivista di probabilità: Sia dato un esperimento e sia C un suo possibile esito, la probabilità dell’evento C è un valore che esprime quanto un individuo “crede” nel fatto che l’evento C si verifichi. P(E)= grado di fiducia accordato al verificarsi dell’evento stesso

PROPRIETA’ DELLA PROBABILITA’ DI UN EVENTO La probabilità di un evento è un numero compreso tra 0 e 1 0  Pr(E)  1 La probabilità di un evento certo è 1P(S) = 1 La probabilità di un evento impossibile (o di un insieme vuoto) è “0” La probabilità dell’evento complementare (Ē) di E è data dalla differenza tra la probabilità di tutto lo spazio campionario (1) meno quella dell’evento P(Ē)=1-P(E)

PROBABILITA’ DELL’UNIONE DI EVENTI: REGOLA DELLA SOMMA P(EF) = P(E)+P(F)-P(EF) P(EF) = P(E)+P(F) per eventi disgiunti E F intersezione

P(AB)=? ESEMPIO LANCIO DI 1 DADO S=[1,2,3,4,5,6] A=[ESCE UN NUMERO PARI] B=[ESCE 2,3,5] P(AB)=?

ESEMPIO Consideriamo 2 gruppi sanguigni a cui una persona può appartenere: 0, B Ipotizzando di conoscere le due probabilità P(gruppo 0)=0.46 P(gruppo B)=0.08 Ci chiediamo qual è la probabilità che un individuo appartenga ad uno dei due gruppi i due eventi sono incompatibili  DISGIUNTI P(gruppo 0  gruppo B) = 0.46+0.08=0.54

ESEMPIO Supponiamo di avere i seguenti dati Titolo studio genitore Elementari medie diploma Titolo studio figlio .04 .01 0.0 .05 Medie .06 .24 .35 Diploma .30 .25 .60 .15 .55 1 P(gd o Fd)=0.3 + 0.60 - 0.25 = 0.65 P(gd o fe) = 0.3 + 0.05 =0.35

LA PROBABILITA’ DI UN EVENTO CONDIZIONATA AD UN ALTRO EVENTO LA PROBABILITA’ CONDIZIONATA E’ LA MISURA CHE ESPRIME LA FIDUCIA CHE UN EVENTO SI VERIFICHI DATO CHE UN ALTRO SI E’ GIA’ VERIFICATO. Dati due eventi A e B, se P(B)>0, allora la probabilità che A si verifichi dato B, è chiamata Probabilità Condizionata e si indica con: P(A|B) P(A dato B) IL FATTO CHE L’EVENTO B SI SIA GIA’ VERIFICATO FA RESTRINGERE LO SPAZIO DEI POSSIBILI ESITI PER A, TALE SOTTOINSIEME E’ DEFINITO IN MODO DA CONTENERE TUTTI E SOLTANTO GLI EVENTI CHE RAPPRESENTANO IL VERIFICARSI DELL’EVENTO CONDIZIONANTE

ESEMPIO Supponiamo di avere i seguenti dati Titolo studio genitore Elementari medie diploma Titolo studio figlio .04 .01 0.0 .05 Medie .06 .24 .35 Diploma .30 .25 .60 .15 .55 1 P(Fd|Ge) = 0.05/0.15 = 0.33 P(Fd|Gm) = 0.30/0.55 = 0.54

ESEMPIO SI CONSIDERI L’ESTRAZIONE SENZA REIMMISSIONE DI DUE CARTE DAL MAZZO A = LA PRIMA CARTA E’ PICCHE B|A = LA SECONDA CARTA E’ PICCHE P(A) = 13/52 P(B|A) = 12/51

PROBABILITA’ DELL’INTERSEZIONE TRA EVENTI: REGOLA DEL PRODOTTO Dati due eventi A e B, P(A  B) = P(A|B)P(B) = P(B|A)P(A) P(A|B)=P(A  B) /P(B) dove P(A|B) è la probabilità condizionata di A dato B e con P(A  B) si indica la probabilità congiunta degli eventi A e B

INDIPENDENZA TRA EVENTI Se due eventi A e B sono indipendenti allora l’avverarsi di 1 non incide sull’avverarsi di un altro La probabilità condizionata di A dato B diventa P(A|B) = P(A) La probabilità dell’intersezione diventa P(A  B) = P(A|B)P(B) = P(A)P(B)

A= SOMMA E’ 6 (si è già verificato) B= UN DADO SEGNA 2 Si lancia una coppia di dadi la somma dei risultati è 6, qual è la probabilità che uno dei due dadi segni 2? A= SOMMA E’ 6 (si è già verificato) B= UN DADO SEGNA 2 P(B|A) = P(B ∩ A)/P(A)= (2/36)/(5/36) = 2/5

QUAL’E’ LA PROBABILITA’ DI ESTRARRE UN MASCHIO CON SCHIZZOFRENIA? Popolazione: 750 individui 100 maschi e 150 femmine con schizofrenia (MSi e FSj) 200 maschi e 300 femmine con depressione (MDi e FDj) Consideriamo i tre eventi così definiti B1={Estrarre una persona con schizzofrenia} Pr(B1)= [250/750] C1={Estrarre una maschio} Pr(C1)= [300/750] QUAL’E’ LA PROBABILITA’ DI ESTRARRE UN MASCHIO CON SCHIZZOFRENIA? Pr(B1 ∩ C1 ) = ?

LA PROBABILITA’ CONDIZIONATA E’ Pr(C1 |B1) = Pr(C1 ∩ B1) / Pr(B1) = (100/750)/(250/750) = 100/250 = 0.4 PER LA REGOLA DEL PRODOTTO Pr(C1 ∩ B1) = Pr(C1 |B1) Pr(B1) = (100/250)(250/750) = 100/750 = 0.133 INDIPENDENZA Pr(C1 ) = (100+200)/750 =300/750 = 100/250 = 0.4 = Pr(C1 |B1) C1 E B1 SONO INDIPENDENTI Infatti Pr(C1 )Pr(B1 ) = (300/750)*(250/750) = 100/750 =0.133 = Pr(C1 ∩ B1)

GLI ESAMI DIAGNOSTICI SERVONO PER DETERMINARE L’EVENTUALE PRESENZA/ASSENZA DI UNA MALATTIA IN UN DETERMINATO SOGGETTO Questi esami hanno come obiettivo il discriminare i soggetti malati da quelli sani, relativamente alla condizione esaminata TEST DIAGNOSTICI - amniocentesi - duo/triplo test - Ecografie, TAC PROGRAMMI DI SCREENING - neoplasia della mammella - neoplasia della cervice uterina - insufficienza tiroidea (neonati)

VALUTAZIONE DELLA PERFORMANCE DI UN TEST DIAGNOSTICO Non esistono test diagnostici che forniscono risultati certi ed affidabili in tutte le situazioni e nel 100% dei casi. L'esito deve essere visto come una indicazione di «probabilità». La probabilità di ottenere risultati «veri» (cioè aderenti alla realtà) è soprattutto legata al tipo di test, non tutti i test raggiungano la stessa probabilità, è possibile invece stilare una sorta di “classifica” della performance dei vari test. Nella situazione più semplice un esame diagnostico fornisce un risultato che può essere espresso come: “esame positivo”/”esame negativo”. Anche gli esami il cui il risultato è espresso su scala continua sono interpretati come Positivi e negativi, identificando dei valori soglia

SCHEMA PER LA VALUTAZIONE DELLA PERFORMANCE DI UN TEST DIAGNOSTICO i soggetti

In base ai risultai del Golden Test si riempiono le 4 celle della TABELLA DI CONTINGENZA La PERFORMANCE di un test dipende dalla quota di risultati falsi-positivi e falsi-negativi generati applicando il test ad una popolazione nella quale la malattia è presente (diagnosticata con il test gold standard). V.P F.N. F.P. RIULTATI GOLDEN TEST ESITO GOLDEN TEST V.N

SENSIBILITA’ E SPECIFICITA’ La SENSIBILITA’ e la SPECIFICITA’ sono le due misure principali che vengono impiegate per valutare la capacità del test di individuare, fra gli individui di una popolazione, quelli provvisti del «carattere» ricercato e quelli che invece ne sono privi. In pratica, per i nostri scopi, il «carattere» è rappresentato quasi sempre dalla malattia o dall'infezione.

La sensibilità indica la capacità del test di identificare correttamente gli individui ammalati. In termini di probabilità, la sensibilità è la probabilità che un soggetto ammalato risulti positivo al test; si può anche dire che essa è la proporzione di soggetti ammalati che risultano positivi al test. SENSIBILITA’: P(T+|M+) =1- P(T-|M+) i soggetti

Ad un esame superficiale, potrebbe sembrare che la sensibilità sia l'unica qualità desiderabile in un test: infatti, sembrerebbe un eccellente risultato il poter identificare correttamente tutti i soggetti con la malattia impiegando un test con una sensibilità del 100%. Tuttavia, esaminando meglio la questione, si giunge alla conclusione che la suddetta qualità non è sufficiente. Infatti, è necessario anche un altro requisito: il test deve identificare come positivi soltanto i soggetti che hanno la malattia; cioè, è necessario che fra i positivi al test non siano inclusi anche degli individui sani.

SPECIFICITA’: P(T-|M-) = 1- P(T+|M-) La specificità è la capacità del test di identificare correttamente i soggetti sani. In termini di probabilità, la specificità è la probabilità che un individuo sano risulti negativo al test; si può anche dire che essa è la proporzione di sani che risultano negativi al test. SPECIFICITA’: P(T-|M-) = 1- P(T+|M-) i soggetti

FALSI POSITIVI E FALSI NEGATVI Falso negativo: esito negativo del test su un individuo malato P(falso negativo) = P(T-|M+) =1- Sens Falso positivo: esito positivo del test su un individuo sano P(falso positivo) = P(T+|M-) = 1- Spec

Esempio sul calcolo della sensibilità e specificità Test basato sulla fosfocreatinchinasi per l’infarto miocardico Casi Non casi T + 215 16 231 T - 15 114 129 230 130 360 Sensibilità = P(T+|M+)=215/230=0.93 Specificità =P(T-|M-)=114/130=0.88 P(falso positivo) =P(T+|M-)=1-specificità=16/130=0.12 P(falso negativo) =P(T-|M+)=1-sensibilità=15/230=0.07 Frequenza di malattia nel campione = Prevalenza = P(M+)=230/360=0.64

MASSIMIZZAZIONE DI SENSIBILITA’ E SPECIFICITA’: L’INFLUENZA DEL VALORE SOGLIA Finora abbiamo illustrato le caratteristiche di un ipotetico test presumendo che esso fornisse risultati del tipo positivo/negativo oppure sano/malato oppure si/no. In altri casi, però, i test forniscono risultati classificabili in più di due categorie oppure su scala continua. In questo ultimo caso i risultati del test devono essere comunque “ dicotomizzati ” e la scelta della soglia che identifica il passaggio da POSITIVO A NEGATIVO (cut-off) influenza sensibilità e specificità del test e la loro massimizzazione contemporanea

DISTRIBUZIONI DEI VALORI DEL TEST NELLE DUE POPOLAZIONI 1) TEST NEGATIVI TEST POSITIVI SOGLIA = 1 SENS = 100% SPEC = 100% 2)

Il valore di cut-off influenza sia la sensibilità che la specificità del test. Esso viene scelto in base ad una serie di considerazioni: ad esempio, deve essere ben nota la storia naturale della malattia, nonché le conseguenze sanitarie ed economiche dei falsi negativi e dei falsi positivi. Nel caso di alcune malattie infettive, talvolta anche un solo falso negativo può risultare particolarmente pericoloso, in quanto escretore dell'agente di malattia e quindi “disseminatore” del contagio.

LA SCELTA MIGLIORE E’ QUELLA DEL COMPROMESSO

Esempio: esame clinico dei linfonodi (confrontato con il test Gold standard dell’esame istologico dei linfonodi) per la diagnosi di metastasi di tumori solidi

SCELTA DEL CUT-OFF: PRIVILEGIARE LA SENSIBILITA’ O LA SPECIFICITA’ UN TEST SENSIBILE DOVREBBE ESSERE SCELTO QUANDO LE CONSEGUENZE DI UNA MANCATA DIAGNOSI SONO PARTICOLARMENTE GRAVI (es. malattie ad esito solitamente mortale, ma che possono essere efficacemente curate). I test sensibili sono utili anche durante il processo diagnostico iniziale, al fine di ridurre il ventaglio di possibilità (diagnosi differenziale) quando esso è ampio. In tal caso, il test sensibile viene applicato soprattutto allo scopo di escludere una o più malattie. Infatti, un test sensibile è di maggior aiuto al clinico quando fornisce un risultato negativo. UN TEST SPECIFICO E’ PARTICOLARMENTE UTILE QUANDO UN RISULTATO FALSO POSITIVO E’ PARTICOLARMENTE DANNOSO (sotto l'aspetto organico, emotivo per il proprietario, finanziario ecc.).

LE CURVE R.O.C. (Receiver Operating Characteristic) Le Curve ROC sono un ulteriore e più moderno approccio per valutare la capacità discriminatoria di un Test (ACCURATEZZA DIAGNOSTICA). Questa rappresentazione grafica :Traccia la probabilità di un risultato vero positivo (sensibilità) in funzione della probabilità di un risultato falso positivo per una serie di punti di cut-off Le curve ROC si utilizzano per: Scegliere il valore soglia + o – consono alle conseguenze diagnostiche del test in base ai punti che formano la retta Paragonare due diversi Test per la diagnosi della stessa malattia in base alla grandezza dell’area sotto le curve

DISEGNARE LE CURVE ROC A La curva si ottiene a partire dai valori di sensibilità e di specificità del test a varie soglie mediante la rappresentazione di punti in un piano cartesiano i cui assi sono definiti da “Sensibilità” e “1 – Specificità” A TEST PERFETTO TEST INUTILE TEST A TEST B TEST SENS=SPEC

LE CURVE PARTONO SEMPRE DAL PUNTO (SE=0, SP=1) CHE INDICA CHE NESSUN PAZIENTE RISULTERA’ POSITIVO AL TEST E TERMINANO NEL PUNTO (SE=1,SP=0) CHE EQUIVALE A DIRE CHE TUTTI I SOGGETTI RISULTERANNO POSITIVI AL TEST UN TEST INFALLIBILE E’ QUELLO NEL QUALE ESISTE UNA SOGLIA TALE PER CUI LA CURVA COINCIDE CON IL PUNTO (SE=1, SP=1), L’AREA SOTTO LA CURVA IN QUESTO CASO E’ UGUALE A 1

IL TEST PEGGIORE E’ QUELLO CHE GENERA UN NUMERO DI VERI POSITIVI UGUALE A QUELLI DI FALSI NEGATIVI, L’AREA SOTTO LA CURVA IN QUESTO CASO E’ 0.5 PIU’ LA CURVA E’ ARCUATA VERSO IL PUNTO DI MASSIMO, MIGLIORE E’ LA CAPACITA’ DISCRIMINATORIA DEL TEST (AREA GRIGIA AREA DI ERRORE) IL PUNTO DI MASSIMO DELLA CURVA E’ QUELLO PIU’ VICINO ALL’ANGOLO IN ALTO A SINISTRA, IN QUESTO PUNTO SI MASSIMIZZANO CONTEMPORANEAMENTE SENSIBILITA’ E SPECIFICITA’

NON SEMPRE SIAMO INTERESSATI AL PUNTO DI MASSIMO DELLA CURVA, NEI TEST DI SCREENING PER CANCRO INFATTI SI PREDILIGONO SOGLIE CHE MASSIMIZZANO LA SENSIBILITA’ A SCAPITO DI MOLTI FALSI POSITIVI CHE VERRANNO DIAGNOSTICATI IN MANIERA CORRETTA CON SUCCESSIVI TEST NEL CASO DI TEST MISURATI SU SCALA CONTINUA LA CURVA ROC E’ FONDAMENTALE PER IDENTIFICARE I VALORI OTTIMI DI CUT-OFF

DEFINIRE IL CUT-OFF DI UN TEST ESEMPIO Hanley e McNeil condussero nel 1982 uno studio su 109 soggetti, 58 sani e 51 con malattie psichiatriche. Ogni soggetto fu sottoposto ad un test, i punteggi ottenuti variarono da 1 a 5 e a valori alti di punteggio è associata una maggiore presenza di “anomarmalità” del soggetto: 1-definitivamente normale, 2- probabilmente normale, 3 – dubbio, - 4- probabilmente anormale, 5- definitivamente anormale. La costruzione della CURVA ROC in questo caso servì per capire quale poteva essere il valore di cut-poin da utilizzare in questo test per classificare i soggetti come normali o come anormali punteggio del test 1 2 3 4 5 | Total -----------+-------------------------------------------------------+---------- malato 1 | 3 2 2 11 33 | 51 sano 0 | 33 6 6 11 2 | 58 Total | 36 8 8 22 35 | 109

CURVA ROC Detailed report of Sensitivity and Specificity ------------------------------------------------------ Correctly Cut point Sensitivity Specificity Classified ( >= 1 ) 100.00% 0.00% 46.79% ( >= 2 ) 94.12% 56.90% 74.31% ( >= 3 ) 90.20% 67.24% 77.98% ( >= 4 ) 86.27% 77.59% 81.65% ( >= 5 ) 64.71% 96.55% 81.65% ( > 5 ) 0.00% 100.00% 53.21% -------------------------------------------------------

UTILIZZO DELLA CURVA ROC PER CONFRONTARE DUE TEST SENSIBILITA’ 1- SPECIFICITA’ CURVA ROC

Importanza pratica di un test Nell’ambito delle operazioni di screening di una popolazione o nell’attività diagnostica ambulatoriale, quando si interpretano i risultati di un test diagnostico, lo specialista è chiamato a rispondere alla domanda: QUAL’E’ LA PROBABILITA’ CHE IL SOGGETTO SIA REALMENTE MALATO (SANO) DATO CHE E’ RISULTATO POSITIVO (NEGATIVO) AL TEST? Valore predittivo positivo (PPV) = P(M+|T+) Valore predittivo negativo (NPV) = P(M-|T-)

Valore Predittivo Positivo: applicazione del teorema di Bayes (PPV): P(M+|T+) = [P(T+|M+)P(M+)]/P(T+) Probabilità a posteriori = (Sensibilità x Prevalenza)/P(T+) P(M) = Probabilità a priori o prevalenza P(T+)= P(T+|M+)P(M+)+P(T+|M-)P(M-) Sens/P(T+) è la verosimiglianza della malattia dato l’esito positivo del test STIMA DEL PPV = P(M+T+)/P(T+)

STIMA DEL PNV = P(M-T-)/P(T-) Valore Predittivo Negativo: applicazione del teorema di Bayes (PNV): P(M-|T-) = [P(T-|M-)P(M-)]/P(T-) Probabilità a posteriori = (Specificità x (1-Prevalenza))/P(T-) P(T-)= P(T-|M-)P(M-)+P(T-|M+)P(M+) Spec/P(T-) è la verosimiglianza dell’assenza di malattia dato l’esito negativo del test STIMA DEL PNV = P(M-T-)/P(T-)

Esempio sull’importanza pratica di un test La prevalenza di una determinata malattia nella popolazione di interesse è del 6%. Il test diagnostico su tale malattia ha una sensibilità del 93% e una specificità dell’88%. Qual è la probabilità che un soggetto sia malato se è risultato positivo al test? P(M+)= 0.06 P(T+| M+ )=0.93 P(T-|M- )=0.88 -P(M+ |T+) = P(T+| M+)P(M+)/P(T+) P(T+) = P(T+ e M+)+P(T+ e M- )=(P(T+| M+ )P(M+))+(P(T+|M-)P(M-)) =0.93 x 0.06 +(1-0.88)x(1-0.06)= 0.93x0.06+0.12x0.94= = 0.06+0.11=0.17 PPV=P(M+|T+)=(0.93x0.06)/0.17=0.33

Decisione diagnostica e prevalenza di malattia nella popolazione considerata La decisione diagnostica (PPV, NPV) non dipende solo dall’efficienza del test (sensibilità e specificità), ma anche dalla prevalenza della malattia nella popolazione considerata Maggiore (Minore) è la prevalenza, maggiore (minore) è il valore predittivo positivo del test (a parità di sensibilità e specificità) L'influenza della prevalenza sul valore predittivo è proporzionale al decrescere della sensibilità e specificità del test

Il fatto che il valore predittivo positivo dipenda dalla prevalenza sconsiglia l'effettuazione di azioni di screening per malattie rare Uno screening per una malattia rara presenta i seguenti inconvenienti: Pochi individui ne trarranno beneficio (proprio in quanto malattia rara) molti individui (i falsi-positivi) ne trarranno un danno, in quanto verranno ingiustamente considerati ammalati

Esempio Test di screening (basato sul dosaggio degli anticorpi) per i donatori di sangue per individuare eventuale sangue infetto da HIV Sensibilità = 0.85 Specificità = 0.99 Prevalenza pop 1= 0,001 Prevalenza pop 2=0,1 Popolazione 1: donatori di sangue (basso num donatori affetti da HIV) odds a priori=P(M+)/P(M-) = 0.001 LR= sensibilità/(1-specificità) = 0.85/0.01=85 odds a posteriori = odds a priori x LR= 0.001x85=0.085 probabilità a posteriori=odds/1+odds = 0,085/1,085 = 0,078 Popolazione 2: tossicodipendenti odds a priori = 0.1 LR= 85 odds a posteriori = 0.1x85 = 8.5 probabilità a posteriori = 8,5/9,5= 0,89

RAPPORTO DI VEROSIMIGLIANZA Un’altra misura utile nella valutazione dell’importanza pratica di un test diagnostico è il RAPPORTO DI VEROSIMIGLIANZA DI UN ESITO DEL TEST. Dato l’esito positivo del test (T+) la verosimiglianza della malattia è data da V(M+ e T+) = Sens/P(T+) = P(T+|M+)/P(T+) La verosimiglianza dell’assenza di malattia dato l’esito positivo è invece V(M- e T+) = 1- Spec/P(T+) = P(T+|M-)/P(T+) Dato l’esito negativo del test (T-) la verosimiglianza della malattia è data da V(M+ e T-) = 1- Sens /P(T-) = P(T-|M+)/P(T-) V(M- e T-) = Spec /P(T-) = P(T-|M-)/P(T-)

RAPPORTO DI VEROSIMIGLIANZA DI UN ESITO POSITIVO LR+=Sens/1-Spec RAPPORTO DI VEROSIMIGLIANZA DI UN ESITO NEGATIVO LR- =Spec/1-Sens L’LR Fornisce una misura della certezza della diagnosi dato il risultato del test (positivo o negativo) Non dipende dalla proporzione di positivi al test P(T+) Non dipende dalla Prevalenza P(M+) Un LR+>1 indica che il risultato del test è associato con la presenza della malattia Un LR-<1 indica che il risultato del test è associato con l’assenza della malattia

Odds di malattia Odds (a priori)=P(M+)/P(M-)=P(M+)/(1-P(M+)) Esempio: L’odds di un evento (malattia) si ottiene facendo il rapporto tra la probabilità che l’evento accada e il suo complemento a 1 (evento non accade): Odds (a priori)=P(M+)/P(M-)=P(M+)/(1-P(M+)) Esempio: Su 125 soggetti 25 sono ammalati: Odds=25/100=0.25 Ogni 4 soggetti sani ne ho uno malato

Odds a posteriori ed evidenza empirica Supponiamo di effettuare un test di screening e di voler aggiornare l’odds (a priori) sulla base del risultato del test: Odds a posteriori = P(M+|T+)/P(M-|T+)= (P(M+) x P(T+|M+)/P(T+)) (P(M-) x P(T+|M-)/P(T+))= Odds a priori x P(T+|M+)/P(T+|M-)= Odds a priori x Rapporto di Verosimiglianza (sensibilità/1-Specificità) Importante: per aggiornare l’Odds non è necessario conoscere la proporzione di soggetti risultati positivi al test, perché il rapporto di verosimiglianza non dipende da tale quantità

Esempio Test basato sulla fosfocreatinchinasi per la diagnosi di infarto del miocardio (Smith,1967) Casi Non casi T + 215 16 231 T - 15 114 129 230 130 360 Odds a priori = (230/360)/(130/360)=230/130 = 1.77 LR(+) = sensibilità/(1-specificità)=0.93/(1-0.88) = 7.75 Odds a posteriori = Odds a priori x LR=1.77 x 7.75 = 13.7 Probabilità a posteriori = odds/1+odds = = 13.7/14.7 = 0,93

RIPRODUCIBILITA’ DELLE MISURE CLINICHE Fino ad ora abbiamo affrontato l’argomento relativo alla validità (incertezza) diagnostica intesa come l’aderenza tra il giudizio clinico dello stato del paziente e lo stato vero del paziente stesso attraverso l’utilizzo dei test diagnostici E’ presente però una seconda componente di errore insito nella formulazione del giudizio clinico che si riferisce alla riproducibilità del giudizio (misura), ovvero all’aderenza tra il giudizi sullo stato di un paziente formulati da più clinici o da un unico clinico in occasione di più visite o di più misurazioni. Di Particolare interesse in questo contesto è la capacità di accordo tra osservatori diversi.

LA CONCORDANZA DIAGNOSTICA Supponiamo che due medici debbano esprimano una diagnosi relativa allo stato di salute di uno stesso paziente (variabile categorica o ordinale). Supponiamo per semplicità che il giudizio diagnostico sia semplicemente: malato/sano. Le due diagnosi potranno essere concordi o discordi: Medico A Medico B Malato Malato concordanza Malato Sano discordanza Sano Sano concordanza Sano Malato discordanza

ESEMPIO Medico A Medico B Sano Malato 10 7 12 Supponiamo che i due medici debbano esaminare 29 pazienti, i dati relativi ai loro giudizi diagnostici possono essere riassunti in una tabella di contingenza 2X2: Le concordanze OSSERVATE sono 22 ( 76%) Le discordanze OSSERVATE sono 7 (24%) Medico A Medico B Sano Malato 10 7 12

Misurare la concordanza diagnostica Misurare la CONCORDANZA semplicemente calcolando la percentuale di diagnosi concordanti è piuttosto superficiale perché non si considera che i clinici potrebbero concordare nella diagnosi per puro effetto del caso La misura corretta che si deve utilizzare per valutare la vera proporzione di accordo ( al netto dell’effetto del caso), cioè quella legata all’utilizzo di criteri omogenei e oggettivi di valutazione del materiale disponibile è l’INDICE K

L’Indice Kappa di Cohen La probabilità di accordo osservata è in parte dovuta al caso, in parte una legata alle caratteristiche dei pazienti. Di solito quindi la concordanza osservata è maggiore di quella che si osserverebbe se i due medici agissero a caso, quindi Kappa >= 0 In teoria però il valore di K può variare tra –1 ed 1 -1 <= Kappa <= 1

Esempio Medico A PA(sano) = 10/29 = 0.345 PA(malato) = 19/29=1-0.345 = 0.655 Medico A Medico B Sano Malato 10 7 12 Medico B PB(sano) = (10+7)/29 = 17/29 = 0.586 PB(malato)=12/29=1- 0.586 = 0.414 Probabilità di concordanza osservata=(10+12)/29=22/29=0.759 Probabilità di concordanza attesa sotto l’ipotesi di “diagnosi casuale” : P(concordanza sano)=PA(sano) x PB(sano) = 0.345 x 0.586=0.202 P(concordanza malato)=PA(malato) x PB(malato) = 0.655 x 0.414=0.271 P(concordanza)=P(concordanza sano)+P(concordanza malato) = 0.202+0.271=0.473