Corso di statistica medica Prof.ssa Cinzia Leuter
Testi consigliati T.Colton, Statistica in medicina Piccin Padova E.Ballatori, Statistica e metodologia della ricerca Margiacchi Editore F.Di Orio, Igiene epidemiologia e statistica, Masson Milano P.Lantieri, D.Risso,G.Ravera, Statistica medica per le professioni sanitarie, McGraw-Hill Milano
La Statistica definizione Analisi quantitativa delle osservazioni di un qualsiasi fenomeno soggetto a variazioni Raccolta e osservazione di dati per spiegarne i modelli di comportamento I metodi statistici consentono di effettuare analisi quantitative di un fenomeno le cui manifestazioni sono osservate attraverso unità di rilevazione
La Statistica La statistica è uno strumento Ha come obiettivi la descrizione,misurazione e la sintesi di un fenomeno Serve per verificare una ipotesi scientifica Descrive i fenomeni mettendone in luce le tendenze (fornisce indicazioni di tipo probabilistico)
Fenomeni collettivi fenomeni collettivi sono quei fenomeni che la nostra mente non può conoscere con una sola osservazione, ma che invece apprende tramite la sintesi delle osservazioni di fenomeni più semplici, detti fenomeni individuali. Fenomeni individuali morti nascite Fenomeni collettivi mortalità natalità
L’attività statistica La progettazione del piano di ricerche L’organizzazione della rilevazione dei dati Lo spoglio e la classificazione delle informazioni raccolte La tabulazione dei dati L’analisi dei dati La sintesi delle informazioni attraverso opportuni parametri statistici
La disciplina statistica Oggetto della Statistica sono quei fenomeni che presentano caratteri di variabilità all’interno di un collettivo di riferimento (popolazione statistica) costituito da unità statistiche elementari
Finalità e caratteristiche del metodo statistico Sviluppo tecnico scientifico in campo medico Evoluzione economico-sociale del Paese Nuovi problemi ed esigenze nei Servizi sanitari Nuova figura di operatore sanitario
Capacità richieste L’operatore sanitario deve acquisire capacità per Identificare formulare rendere operativi i metodi per soddisfare le nuove necessità sanitarie Pianificare - organizzare - erogare - valutare i servizi (prevenzione, cura educazione sanitaria) Partecipare alla ricerca
Come raggiungere questi obiettivi Studiare le malattie e le loro cause Osservare l’evoluzione delle malattie e dei bisogni dei pazienti Interpretare i fenomeni e modificare modalità operative ed organizzative Acquisire spirito critico per valutare i risultati Assumere decisioni per ottimizzare le prestazioni erogate È importante l’approccio quantitativo ai problemi sanitari
La Statistica Insegna ad utilizzare il metodo scientifico per raccogliere,organizzare l’informazione favorendo la comprensione dei fenomeni naturali Fornisce una serie di metodi per dare un valore oggettivo e generale alle esperienze attraverso la quantificazione dei fenomeni
Le informazioni statistiche Base necessaria per la programmazione di interventi diretti a risolvere problemi della popolazione di un Paese Per interventi in campo sanitario possiamo distinguere due categorie essenziali: Statistiche demografiche Statistiche sanitarie
Statistiche demografiche Struttura della popolazione Nascite Morti Migrazioni Previsioni demografiche
Statistiche sanitarie
Stato di salute Salute percepita Qualità della vita Stili di vita Morbosità Disabilità Mortalità
Servizi sanitari ► Attività degli istituti di cura ► Day hospital ► Accertamenti diagnostici ► Visite mediche generali e specialistiche ► Uso di farmaci e medicina alternativa ► Atteggiamento verso i servizi sanitari
Assistenza ■Le persone negli istituti ■L’assistenza sociale ■Le pensioni ed i pensionati
Spesa sanitaria Conti sanitari nazionali e regionali Modelli di previsione della spesa sanitaria
Popolazione e unità statistiche L’insieme di tutti gli elementi che si vogliono osservare rispetto a un dato fenomeno si definiscono universo statistico o popolazione I singoli elementi della popolazione si chiamano unità statistiche Possono essere: semplici ( singoli individui, incidenti domestici …) composte ovvero aggregati di unità semplici (famiglie, classi scolastiche)
Le grandi aree della Statistica(1) Statistica Descrittiva Metodo deduttivo (dal generale al particolare) Raccolta dei dati Sintesi dei dati di un campione Presentazione dei risultati (analisi esplorativa)
Le grandi aree della Statistica(2) Statistica inferenziale Metodo induttivo (dal particolare al generale) Rilevazioni parziali (campioni rappresentativi) Stima dei parametri di una popolazione ignota Verifica delle ipotesi
Caratteri e modalità Data una popolazione, si definisce carattere una particolare caratteristica che si presenta in ciascun elemento della popolazione in forme differenti o modalità Studiare una popolazione secondo un dato carattere significa osservare come si distribuiscono in essa le modalità del carattere esaminato Le modalità del carattere in esame devono essere incompatibili ed esaustive: ciascun elemento della popolazione presenta una e una sola delle modalità del carattere in esame
I caratteri statistici Un insieme di unità statistiche può essere descritto secondo uno o più caratteri selezionati in funzione degli obiettivi della ricerca(sesso, età, statura, salute....) L’attribuzione di una modalità (classificazione delle unità statistiche) porta alla formazione del dato statistico Una distribuzione statistica è l’insieme delle modalità che un carattere presenta in un insieme N di unità statistiche
Classificazione dei caratteri Quantitativi (variabili) Caratteri le cui modalità sono misurabili ( a ciascuna corrisponde un numero che esprime una misura) Continuo (possono assumere qualunque valore tra due valori dati) Pressione sanguigna Altezza,( 1,60.. 1,65- 1,66…1,70) peso Discreto (possono assumere solo alcuni valori) Numero bambini, numero attacchi asma alla settimana,... (n figli: possono essere 1, 2,3.. Non 1,4 o 2,5 !!)
Classificazione dei caratteri Qualitativi (mutabili) Caratteri le cui modalità non sono il risultato di misurazioni in senso fisico Ordinale (categorie ordinate) Stadio del cancro al seno; migliore- uguale- peggiore; non sono d’accordo- neutro- sono d’accordo. Sconnesso (categorie non ordinate) Sesso (maschio- femmina); vivo-morto; gruppo sanguigno 0,A,B,AB
Relazioni e operazioni fra le modalità CaratteriRelazioni e operazioni Qualitativi sconnessiUguaglianza e disuguaglianza Qualitativi ordinatiUguaglianza e disuguaglianza;ordinamento QuantitativiUguaglianza e disuguaglianza;ordinamento; addizione e sottrazione
CARATTERI E MODALITÀ Le modalità di ogni carattere sono selezionate in base alle unità statistiche in esame, all’oggetto dello studio e alla scelta dell’osservatore Carattere Modalità Sesso - maschio, femmina Colore occhi - marroni, verdi, celesti scuri, chiari Statura -1,55 1,69 1,75 1,80 minore di 1,65, compreso tra 1,65 e 1,80 maggiore di 1,60..
Trasformazione dei caratteri Da quantitativi a qualitativi Statura in cm basso, medio, alto Pressione arteriosa in mm/Hg ipertensione moderata, lieve, grave La trasformazione può essere utile ma comporta una perdita di informazione
Classificazione dei caratteri statistici secondo il livello di misurazione Scale nominali Sono rappresentate da quei caratteri qualitativi le cui modalità non presentano alcun ordine di successione e senza relazione quantitativa tra esse (sesso, professione, religione...) Si possono formulare solo i giudizi: di uguaglianza di disuguaglianza
Classificazione dei caratteri statistici secondo il livello di misurazione Scale ordinali Sono rappresentate da quei caratteri qualitativi le cui modalità presentano un ordine di successione ma non una grandezza: ordinamento di un gruppo di individui secondo un dato carattere Ordine crescente di: reddito, titolo di studio, stadio di una malattia...
Classificazione dei caratteri statistici secondo il livello di misurazione Scale ad intervalli Sono rappresentate da caratteri quantitativi disposti in una scala ordinale in cui è possibile misurare la distanza tra di essi espressi in valori singoli o in classi di valori (lunghezza, statura, peso,....)
Le classificazioni di caratteri e scale Terminologia italianaTerminologia anglosassone Carattere qualitativo sconnesso Scala nominale Carattere qualitativo ordinatoScala ordinale Carattere quantitativoScala di intervalli
Esempio Un gruppo di studenti è stato classificato secondo alcune informazioni NE = quantitativo discreto V = quantitativo Val = qualitativo ordinato CL = qualitativo sconnesso studenteN esami votovalutazioneCondizione lavorativa 1224buonolavoratore 2118sufficientelavoratore 3230ottimonon lavoratore 4128ottimolavoratore 5120sufficientenon lavoratore 6324buonolavoratore
Raccolta e organizzazione dei dati
Le fasi delle ricerca Definizione del problema Formulazione del disegno di ricerca Raccolta dei dati Valutazione della qualità del dato Elaborazioni statistiche Interpretazione dei risultati Corso di Statistica
Definizione del problema Si stabiliscono gli obiettivi della ricerca Si definisce il fenomeno Si sceglie la popolazione in cui il fenomeno si manifesta Si individuano le caratteristiche della popolazione che interessano lo studio. Corso di Statistica
INDAGINE STATISTICA Sull’intera popolazione (censimento famiglie italiane) Su un campione della popolazione statistica (indagine campionaria) Indagine statistica Raccoglie e analizza i dati Statistica descrittiva Trarre indicazioni sull’intera popolazione (descrivere il fenomeno) Statistica inferenziale Trarre indicazioni dal campione che siano valide per l’intera popolazione
Il concetto di popolazione statistica L’insieme di tutti gli elementi (unità statistiche) che posseggono il carattere esaminato costituisce l’universo o la popolazione statistica Le unità statistiche possono appartenere a più popolazioni ES : maschio adulto ↓ popolazione Ipertesi coniugati ricoverati Paziente ricoverato ↓ unità statistica Cartella clinica ↓ Insieme di variabili (caratteri)
Organizzazione dei dati I dati rilevati vengono trascritti Talvolta è necessaria la trasformazione in codici (simboli alfanumerici) lo spoglio dei dati consiste nel classificare ciascuna unità statistica in base alla modalità rilevata Es: 25 soggetti in base al gruppo sanguigno Rilevazione : A,B,B,0,0,AB,0,A,A,0,0,B,AB,A,A,0,0,A,AB,B,,B,0,B,AB Prospetto: 0 IIIIIIII A IIIIIII Modalità B IIIIII AB IIII Frequenze osservate
Classificazione di una popolazione per modalità o per frequenze Si cercano quale modalità dei caratteri considerati è presente in ciascuna delle unità statistiche della popolazione e raggruppando (contando) le unità che si presentano con modalità uguali (frequenze)
Frequenza e distribuzioni di frequenza Per frequenza si intende il numero di volte che si è manifestato un fenomeno Una distribuzione di frequenze fa riferimento al complesso di dati rilevati unendo quelli con le stesse caratteristiche Per ogni modalità del carattere osservato (statura, sesso,..) per frequenze assolute (n i ) si intende il numero delle unità nelle quali il carattere presenta la stessa modalità i -ma
Tabella di dati grezzi qualitativi soggettofumatoresoggettofumatoresoggettofumatore 1 si 11 si 21 si 2 no 12 si 22 no 3 si 13 no 23 si 4 14 si 24 si 5 no 15 si 25 no 6 si 16 si 26 no 7 si 17 no 27 si 8 no 18 si 28 si 9 no 19 no 29 si 10 no 20 no 30 si
Spoglio dei dati rispetto alla variabile fumo ModalitàSpoglio dei datiFrequenze FumatoriIIII IIII IIII III 18 Non fumatoriIIII IIII II II 12 TotaleIIIIIIIIIIIIIIIIIIIIII IIIIIIIIIIIIIIIIII 30
Distribuzioni di frequenze Se la distribuzione di frequenze è fatta per un solo carattere, la distribuzione è definita semplice Se i caratteri rispetto ai quali è fatta la distribuzione sono due, tre …. m, la distribuzione di frequenza sarà doppia, tripla,….multipla
La matrice dei dati I dati codificati in una in una rilevazione statistica su n unità statistiche studiando x variabili sono raccolti in forma di tabella (matrice di dati) NsessoEtà (anni) Peso (Kg) Titolo di studio n.° ricoveri 1M4283laurea2 2F4865diploma n F 6179Licenza media inferiore 4
La matrice dei dati Ogni riga corrisponde ad una unità statistica NsessoEtà (anni) Peso (Kg) Titolo di studio n.° ricoveri 1M4283laurea2 2F4865diploma n F 6179Licenza media inferiore 4
La matrice dei dati Ogni colonna rappresenta una variabile NsessoEtà (anni) Peso (Kg) Titolo di studio n.° ricoveri 1M4283laurea2 2F4865diploma n F 6179Licenza media inferiore 4
Analisi ed elaborazione statistica dei dati Sintesi dei dati Tabelle frequenze (distribuzioni di frequenze) Indici statistici Per sintetizzare un caratterePer confrontare diverse situazioni
50 unità classificate secondo la statura
Distribuzione in classi In presenza di un carattere con molte modalità è possibile (è conveniente!) formare delle classi di valori Ne deriverà una variabile statistica divisa per intervalli o classi di frequenza In ciascuna delle classi si raccolgono tutte le osservazioni che cadono al suo interno I dati così organizzati costituiscono una distribuzione di frequenze definita distribuzione in classi
Distribuzione in classi I valori minimo massimo della classe si definiscono limiti di classe: limiti inferiori e limiti superiori Statura in cm frequenze assolute (classi) n i 140 – – – – – Ciascuna coppia di limiti costituisce l’intervallo della classe
Distribuzione in classi Statura in cm frequenze assolute (classi) n i 140 – , – , – – – Il valore centrale di una classe è dato dalla semisomma degli estremi limite inferiore + limite superiore 2
Criteri per costruire una distribuzione in classi Identificare il campo di variazione (differenza tra il valore più grande e il più piccolo) Suddividere il campo di variazione in un numero conveniente di classi secondo la numerosità dei dati Una tabella con un numero elevato di classi è troppo simile alla tabella di origine dei dati; una con poche classi, eccessivamente ampie, fa perdere troppe informazioni Gli intervalli di classe dovrebbero avere la stessa ampiezza L’obiettivo della divisione in classi è una migliore leggibilità della tabella senza perdere troppe informazioni !
Esempio di suddivisione in classi Suddivisione in classi uguale ampiezza L’ampiezza delle classi è data dalla differenza tra il valore massimo osservato e il valore minimo diviso il numero di classi che si vogliono : V max – V min / K (n. classi da costruire) ES: 19 – 7 / 4 = 3
Distribuzione di frequenza di 50 unità classificate secondo la statura Statura in cm. Unità statistiche frequenze assolute (in classi) n i II IIIIIIIII IIIIIIIIIIIIIIIII IIIIIIIIIIII IIIIIIII II 2
Frequenza, distribuzioni di frequenza II La somma delle frequenze assolute è = al totale N delle unità del collettivo Oltre le frequenze assolute si considerano le frequenze relative indicano il rapporto tra la frequenza assoluta della modalità i –ma e il numero totale N La somma di tutte le frequenze relative di tutte le modalità in cui si articola il carattere considerato è =1 (o a 100 se le frequenze relative sono espresse in percentuali)
Distribuzione di frequenza di 50 unità classificate secondo la statura Statura in cm. frequenze assolute frequenze Frequenze % (in classi) assolute relative n i
Distribuzione di frequenza variabile qualitativa Colore degli occhi Frequenza Assoluta Relativa Percentuale n i f i % Modalità Castani Azzurri Verdi Totale(Σ i ) Frequenze relative = frequenze assolute totale Frequenze percentuali = frequenze relative x 100
Uso di frequenze percentuali(1) In presenza di osservazioni di più caratteri contemporaneamente si possono calcolare più frequenze relative e percentuali Si possono dare interpretazioni errate se non si definisce accuratamente il denominatore Es: la frequenza % delle donne che fumano può essere calcolata in riferimento al totale delle donne, in relazione al totale dei fumatori, al totale dei soggetti esaminati La frequenza assoluta delle donne fumatrici (numeratore) è sempre la stessa. Il denominatore cambia in base ad ogni possibile relazione
Uso di frequenze percentuali(2) Attenzione al significato che si attribuisce alle percentuali in presenza di una bassa numerosità delle frequenze! Piccole variazioni, probabilmente casuali, vengono sottolineate alterando il risultato ES. Se mensilmente i ricoverati per una patologia passano da 4 a 5 e successivamente a 3, appare ingiustificato evidenziare variazioni percentuali sensibili rispettivamente di +25% e -40% Pur se esatto il calcolo matematico, statisticamente si attribuisce un eccesso di significato a banali fluttuazioni in un fenomeno che appare costante nel tempo
Variabile sesso Frequenze assolute (n ) matricole di Statistica Medicina M F Frequenze relative (f) matricole di Statistica Medicina M (16/33)=48.5% (33/125)=26,4% F (17/33)=51.5% (92/125)=83,6%
Variazioni percentuali EtàPeso iniziale Peso finale Variazione % Paziente ,4 Paziente ,1 Paziente ,1 Paziente ,1 P f – P i / P i x – 58 / 58 x 100 = 3,4
Frequenze cumulate La frequenza cumulata (assoluta, relativa e percentuale) in corrispondenza di un valore X i indica il numero di volte che la variabile X ha assunto valori pari o inferiori a X i Frequenze assolute cumulate C 1 = N 1 C 2 = N 1 +N 2 C 3 =N 1 +N 2 +N C k = N 1 +N 2 +N N k
Distribuzione in classi:caratteristiche e quadro delle frequenze classePeso (Kg)x c ff % f cum f %cum I40├ II45├ III50├ IV55├ V60├ VI65├ VII70├ Valori centrali x c (40+45)/2=42.5; (45+50)/2=47.5;.....; (70+75)/2=72.5 Ampiezza di classe c partendo dai confini: 45-40=5; 50-45=5;..... ; 75-70=5;
Più variabili rilevate per unità statistica Distribuzione di frequenza di 50 unità classificate secondo il sesso Sesso unità statistiche frequenze assolute n i Maschi IIIIIIIIII IIIIIIIIII III 23 Femmine IIIIIIIIII IIIIIIIIII IIIIIIII 27
Più variabili rilevate per unità statistica Distribuzione di frequenza di 50 unità classificati per sesso e statura Statura in cm. Sesso Totale Maschi Femmine Totale
Schema per tabella a due entrate Y X CARATTERE Y Totale riga y1y1 y2y2 y 3 …..y j …..ymym C A R A T E R E X x 1 f 11 f 12 f 13 …f 1j …f 1m F1F1 x2x2 f 21 f 22 f 23 …f 2j …. f 2m F2F2 x 3 …… f 31 f 32 f 33 …f 3j …f 3m F3F3 x i …. f j1 ….. f j2 ….. f j3 …. ….. f ij … ….. f im ….. F i …… xnxn f n1 f n2 f n3 …f nj...f nm FnFn Totale colonna F1F1 F2F2 F F.j......F.m F..