STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Corso di Laurea Triennale in Infermieristica Anno III PRIMA LEZIONE
VARIABILE : caratteristica di tipo qualitativo o quantitativo dei soggetti analizzati Le variabili si distinguono appunto in v. qualitative o categoriali e v. quantitative Una variabile è qualitativa quando si estrinseca attraverso un insieme finito di modalità o categorie Le variabili qualitative si distinguono in ordinali quando esiste una gerarchia tra le categorie e non ordinali in caso contrario
VARIABILI
ESEMPI DI VARIABILI QUALITATIVE Sesso di un paziente (non ordinale) Maschio, Femmina Stato di un paziente (non ordinale) In cinta, No Diabetico, No Iperteso, Normoteso Stato di un paziente (ordinale) non fumatore, ex-fumatore, fumatore moderato, fumatore forte Grado di dolore (ordinale) Minimo, Moderato, Forte, Molto forte Stadio tumorale (ordinale) I, II, III, IV
Una variabile è quantitativa quando si estrinseca attraverso delle quantità Le variabili quantitative si distinguono in v. discrete e v continue Le variabili discrete derivano in genere da conteggi
ESEMPI DI VARIABILI DISCRETE Numero di cesarei effettuati giornalmente in una clinica ostetrica 0, 1, 2, 3, … Numero di figli di una paziente
Le variabili continue derivano in genere da misurazioni Peso corporeo, Statura, Temperatura corporea, Pressione arteriosa, Livello di colesterolo, ecc. Per esprimere le variabili quantitative si deve specificare l’unità di misura Esempio: peso di 3 neonati (1 lb = 0.4536 kg) 1 2 3 kg 2.9 3.3 3.1 g 2900 3300 3100 lb 6.39 7.28 6.83
protocollo sperimentale STATISTICA DESCRITTIVA SIMBOLOGIA In genere la variabile oggetto di studio si indica con il simbolo X, per cui se si misura tale variabile su n soggetti, si indica con x1 il valore di tale variabile rilevato sul soggetto 1, con x2 il valore rilevato sul soggetto 2, con xn il valore rilevato sul soggetto n. Dunque la sequenza x1,x2,…,xn costituisce il nostro protocollo sperimentale da sintetizzare con le metodologie della STATISTICA DESCRITTIVA
DISTRIBUZIONI DI FREQUENZA
VARIABILI QUALITATIVE Nel caso di una variabile qualitativa rilevata su n soggetti, le categorie tendono a ripetersi. Il protocollo sperimentale è dunque costituito da sigle che si susseguono in modo disordinato ripetendosi.
ESEMPIO 1 Rileviamo su 80 pazienti ricoverati in una clinica per malattie cardiovascolari la variabile FUMO, utilizzando 4 categorie ordinali: non fumatore (NF), ex fumatore (EF), fumatore moderato (FM), fumatore forte (FF) Protocollo sperimentale (dati): FM,NF,FF,NF,EF,NF,FF,FM,NF,NF,NF,NF,FM,EF,NF,FM,NF,FM,NF,FF, FM,FM,FM,NF,NF,FF,FF,NF,NF,NF,NF,FF,FF,NF,EF,EF,NF, FM,NF,FM, NF,EF,NF,NF,EF,NF, FM,NF,FM,NF,FM,NF,FM,NF,NF,FF,FM,NF,FF,FM, FM,FF,FM,FF,NF,FM,FF,EF,FF,FM,FF,NF,FF,EF,FM,FM,FF,FM,FM,NF ???
Per mettere ordine nei dati possiamo considerare le frequenze assolute o le frequenze relative delle singole categorie e riportarle in una tabella detta distribuzione di frequenza La distribuzione di frequenza può essere rappresentata graficamente con un diagramma a barre verticali di altezza proporzionale alle frequenze (relative o assolute)
ESEMPIO 1 X f.a. f.r f.r % NF 32 0.4 40% EF 8 0.1 10% FM 24 0.3 30% FF 16 0.2 20% tot 80 1 100% Ovviamente la somma delle frequenze assolute è uguale al numero di soggetti mentre la somma delle frequenze relative è uguale a 1 (o a 100 se percentualizzate)
FREQUENZE ASSOLUTE
FREQUENZE RELATIVE
ESEMPIO 2 In una clinica ostetrica si sono verificati in due anni 60 morti perinatali. Per ogni caso è stato rilevato il giorno della settimana in cui la morte è avvenuta. Protocollo sperimentale (dati) sab,dom,gio,lun,sab,gio,mer,mar,ven,sab,mer,lun,sab,ven,mar, sab,dom,mar,dom,dom,dom,mer,sab,ven,mer,gio,gio,mar,sab,mer, dom,ven,dom,dom,gio,lun,mer,sab,dom,sab,sab,dom,lun,sab,dom, ven,lun,dom,dom,mar,dom,lun,mer,sab,gio,mer,ven,dom,mar,mer ???
X f.a f.r. f.r. % lun 6 0.10 10% mar mer 9 0.15 15% gio ven sab 12 0.20 20% dom 15 0.25 25% tot 60 1 100%
VARIABILI DISCRETE Anche nel caso di una variabile discreta rilevata su n soggetti, i valori tendono a ripetersi. Il protocollo sperimentale è dunque costituito da numeri interi che si susseguono in modo disordinato ripetendosi.
ESEMPIO 3 In una clinica ostetrica è stato rilevato il numero di figli su 120 partorienti. Protocollo sperimentale (dati) 1,1,0,5,2,0,1,2,0,1,3,1,0,4,1,0,0,2,3,1,0,2,4,1,1,0,3,2,1,0, 5,1,4,1,1,0,2,0,3,0,2,1,2,0,1,0,2,1,0,2,2,1,1,2,0,0,0,1,2,1, 2,1,1,1,2,2,2,0,2,1,1,0,1,0,3,0,1,3,0,2,1,4,1,2,1,3,0,1,2,0, 0,3,1,1,1,2,0,5,1,4,1,0,2,1,3,0,3,1,2,3,1,4,2,1,3,2,1,0,2,1 ???
X f.a. f.r. f.r.% 30 0.250 25% 1 42 0.350 35% 2 27 0.225 22.5% 3 12 0.100 10% 4 6 0.050 5% 5 0.025 2.5% tot 120 100%
VARIABILI CONTINUE Al contrario, nel caso di una variabile discreta rilevata su n soggetti, i valori tendono a essere tutti distinti Il protocollo sperimentale è dunque costituito da numeri reali quasi tutti distinti che si susseguono in modo disordinato. In questo caso le frequenze dei valori distinti sono quasi tutte uguali a 1
DISTRIBUZIONE DI FREQUENZA PER CLASSI Si considera un intervallo che contenga tutti i valori osservati e lo si divide in intervalli o classi non necessariamente di uguale ampiezza Si considerano poi le frequenze assolute o relative delle varie classi
ESEMPIO 4 In un reparto di chirurgia sono stati rilevati i valori di glicemia su 40 pazienti operati nella giornata precedente Protocollo sperimentale (dati) 70, 71, 72, 73, 89, 88, 68 84, 96, 74,81,69,77,92,68,82,79,93,85,95 66, 95, 86, 90, 75, 65, 94, 57, 80, 86,88,54,71,67,66,89,70,68,80,91 ??? Valore minimo 54, valore massimo 96 Tutti i dati sono compresi tra 50 e 100 Si divide l’intervallo 50-100 in 5 classi di ampiezza 10 Si contano le frequenze in tali intervalli
Classi f.a f.r f.r % 50-60 2 0.05 5% 60-70 8 0.20 20% 70-80 10 0.25 25% 80-90 12 0.30 30% 90-100 tot 40 1 100%
ISTOGRAMMA rettangolo con area A proporzionale alla frequenza (p.es frequenza percentuale) e base B uguale all’ampiezza della classe Altezza H ? Quando le classi sono di uguale ampiezza l’altezza è proporzionale alla frequenza H H B B
ESEMPIO 5 Sono stati rilevati i livelli di IgM (mg/dl) su 40 bambini Protocollo sperimentale (dati) 111, 109, 63, 107, 125, 112, 170, 193, 119, 199, 106, 16, 110, 107, 37, 101, 292, 75, 116, 208, 45, 98, 115, 312, 307, 68, 77, 381, 129, 135, 220, 59, 148, 103, 94, 241, 88, 83, 259, 267 ??? Valore minimo 16, valore massimo 381 Tutti i dati sono compresi tra 0 e 400 Si divide l’intervallo 0-400 in 5 classi di varia ampiezza Si contano le frequenze in tali intervalli
densità della frequenza ISTOGRAMMA rettangolo con area A proporzionale alla frequenza (p.es frequenza percentuale) e base B uguale all’ampiezza della classe Altezza H ? Dal momento che A=BxH, allora H=A/B A H densità della frequenza H H A B B
Classe f.a. f.r. f.r. % 0-60 4 0.10 10% 60-100 8 0.20 20% 100-120 12 0.30 30% 120-270 270-400 Tot 40 1 100%
ISTOGRAMMA CLASSE 0-60 B=60, A=10 → H=10/60=1/6~0.17 ISTOGRAMMA CLASSE 60-100 B=40, A=20 → H=20/40=1/2=0.5 ISTOGRAMMA CLASSE 100-120 B=20, A=30 → H=30/20=3/2=1.5 ISTOGRAMMA CLASSE 120-270 B=150, A=30 → H=30/150=0.2 ISTOGRAMMA CLASSE 270-400 B=130, A=10 → H=10/130=1/13~0.07
Categoria o valore con la massima frequenza CLASSE MODALE Classe con la massima densità delle frequenze (istogramma più alto) ↑ classe modale ↑ moda
UNITA’ DI MISURA Il cambiamento dell’unità di misura si effettua con una trasformazione lineare del tipo Y=bX Es. Per passare da Kg a grammi b=1000 3.4 kg divengono 3400 grammi Per passare da Kg a lb b=2.204 3.4 kg diventano 7.49 lb PROBLEMA Molti indici statistici sono influenzati dall’unità di misura (cambia la convenzione cambia l’indice)