STATISTICA PER LA RICERCA SPERIMENTALE E ECNOLOGICA Corso di Laurea Triennale in Infermieristica Anno III QUARTA LEZIONE
RELAZIONI TRA VARIABILI QUALITATIVE
COEFFICIENTE DI CORRELAZIONE PER RANGHI (SPEARMAN) Misura la correlazione tra due variabili di tipo ordinale E’ semplicemente il coefficiente di correlazione lineare calcolato sui ranghi di X e di Y Rango: posizione nella sequenza delle osservazioni ordinate di differenza tra i ranghi di X e Y per il soggetto i
le seguenti categorie NF(non fumatore), EF (ex fumatore), FM (fumatore Es. Su n=8 soggetti è stata rilevata la variabile X (fumo) che può assumere le seguenti categorie NF(non fumatore), EF (ex fumatore), FM (fumatore moderato), FF (fumatore forte) e la variabile Y (sensibilità olfattiva) che può assumere le categorie S (scarsa), M (moderata), B (buona) X Y Rango X Rango Y Diff Diff2 NF B 2 7 -5 25 S 2.5 -0.5 0.25 EF 4 1.5 2.25 FM 6 -1 1 3.5 12.25 M 5 FF 8 5.5 30.25 97
rs = 1 – (6 x 97)/(8 x 63) = 1 – 1.15 = - 0.15 Esiste una lieve dipendenza lineare negativa tra i ranghi che implica una lieve dipendenza negativa tra X e Y In pratica la sensibilità olfattiva mostra una lieve diminuisce tendenza a diminuire al crescere del grado di dipendenza al fumo
X Y Rango X Rango Y dif dif2 I A 1 II M 2.5 2 0.5 0.25 F 3.5 III 4 IV Es. Su 5 pazienti è stato rilevato lo stadio tumorale X (I,II,III,IV) e il livello di dolore (A=assente, M=moderato, F=forte, MF=molto forte) X Y Rango X Rango Y dif dif2 I A 1 II M 2.5 2 0.5 0.25 F 3.5 III 4 IV MF 5 1.5
rs = 1 – (6 x 1.5)/(5 x 24) = 1 – 0.075 = 0.925 Esiste una forte dipendenza lineare positiva tra i ranghi che implica una forte dipendenza positiva tra X e Y In pratica il dolore tende ad aumentare con lo stadio tumorale
TABELLE DI CONTINGENZA (variabili dicotomiche) Si ottengono incrociando le distribuzioni di frequenza di due variabili X e Y per analizzare il loro livello di associazione Sia X la v. dicotomica che indica la presenza o l’assenza di una causa (?) di una patologia e sia Y la v. dicotomica che indica la presenza o l’assenza della patologia stessa Studiare l’associazione tra X e Y equivale a determinare l’effetto che ha X sull’insorgenza della patologia
Es. Dipendenza tra fumo (X) e cancro polmonare (Y) n=1092 soggetti cancro SI NO tot 459 534 993 18 81 99 477 615 1093 fumo Rischio tra i fumatori 459/993=0.46 (46%) Rischio tra non fumatori 18/99=0.18 (18%) Rapporto di rischio RR=0.46/0.18=2.55 La percentuale di tumori tra i fumatori e 2 volte e mezzo più alta di quella osservata tra i non fumatori
Es. Dipendenza tra tossicodipendenza e AIDS n=30 soggetti AIDS SI NO tot 7 2 9 5 16 21 12 18 30 toss Rischio tra i toss. 7/9=0.78 (78%) Rischio tra non toss 5/21=0.24 (24%) Rapporto di rischio RR=78/24=3.25 La percentuale di sieropositivi tra i toss. è circa 3 volte più alta di quella osservata tra i non toss
In caso di assenza di associazione RR=1 RAPPORTO DI RISCHIO X causa (?) SI-NO Y patologia SI-NO n soggetti SI NO tot a b a+b c d c+d a+c b+d X In caso di assenza di associazione RR=1
Es Dipendenza tra attività fisica (X) e infarto (Y) n=100 casi infarto SI NO tot 6 32 38 11 51 62 17 83 100 att fis Rischio tra coloro che fanno att. fis. 6/38=0.16 (16%) Rischio tra coloro che non fanno att.fis 11/62=0.18 (18%) Rapporto di rischio RR=18/16=1.1 La percentuale di infarti tra coloro che non fanno att. fis è simile a quella di coloro che la effettuano
SENSITIVITA’ – SPECIFICITA’ Sia X la v. dicotomica che indica la positività ad un certo test diagnostico (esame clinico) e sia Y la v. dicotomica che indica la presenza o l’assenza di una patologia Studiare l’associazione tra X e Y equivale a determinare l’efficienza del test diagnostico
Tutti i patologici sono stati correttamente identificati dal test MASSIMA EFFICIENZA Y SI NO tot a d X Tutti i patologici sono stati correttamente identificati dal test Tutti i non patologici sono stati correttamente identificati dal test
Se = a/(a+c) SENSITIVITA’ patologici SI NO tot a b a+b c d c+d a+c b+d Tot positivi Se = a/(a+c) SENSITIVITA’ proporzione di patologici correttamente identificati dal test Se = d/(b+d) SPECIFICITA’ proporzione di non patologici correttamente identificati dal test
Es. Il livello di colesterolo (mg/dl) è stato misurato su un campione di n=344 Individui considerando come positivi (Y) valori superiori a 240 mg/dl. Nel follow up successivo sono stati registrati i casi di cardiopatia ischemica (X) rilevati nei 344 individui patologici SI NO tot 31 97 128 21 195 216 52 292 344 positivi Se = 31/52 = 0.67 SENSITIVITA’ 60% di cardiopatici correttamente identificati Sp = 195/292 = 0.67 SPECIFICITA’ 67% di sani correttamente identificati
Es. Se si fossero considerati positivi livelli di colesterolo superiori a 200 mg/dl si sarebbero ottenuti i seguenti risultati patologici SI NO tot 37 155 192 15 137 152 52 292 344 positivi Se = 37/52 = 0. 71 SENSITIVITA’ 71% di cardiopatici correttamente identificati Sp = 137/292 = 0.47 SPECIFICITA’ 47% di sani correttamente identificati