La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Corso di statistica medica Prof.ssa Cinzia Leuter tel. 340 7149124.

Presentazioni simili


Presentazione sul tema: "Corso di statistica medica Prof.ssa Cinzia Leuter tel. 340 7149124."— Transcript della presentazione:

1 Corso di statistica medica Prof.ssa Cinzia Leuter tel

2 Testi consigliati T.Colton, Statistica in medicina Piccin Padova E.Ballatori, Statistica e metodologia della ricerca Margiacchi Editore F.Di Orio, Igiene epidemiologia e statistica, Masson Milano P.Lantieri, D.Risso,G.Ravera, Statistica medica per le professioni sanitarie, McGraw-Hill Milano

3 La Statistica definizione Analisi quantitativa delle osservazioni di un qualsiasi fenomeno soggetto a variazioni Raccolta e osservazione di dati per spiegarne i modelli di comportamento I metodi statistici consentono di effettuare analisi quantitative di un fenomeno le cui manifestazioni sono osservate attraverso unità di rilevazione

4 La Statistica La statistica è uno strumento Ha come obiettivi la descrizione,misurazione e la sintesi di un fenomeno Serve per verificare una ipotesi scientifica Descrive i fenomeni mettendone in luce le tendenze (fornisce indicazioni di tipo probabilistico)

5 Fenomeni collettivi fenomeni collettivi : sono quei fenomeni che non si possono conoscere con una sola osservazione, ma si apprendono tramite la sintesi delle osservazioni di fenomeni più semplici, detti fenomeni individuali. Fenomeni individuali morti nascite Fenomeni collettivi mortalità natalità

6 Lattività statistica La progettazione del piano di ricerche Lorganizzazione della rilevazione dei dati Lo spoglio e la classificazione delle informazioni raccolte La tabulazione dei dati Lanalisi dei dati La sintesi delle informazioni attraverso opportuni parametri statistici

7 La disciplina statistica Oggetto della Statistica sono quei fenomeni che presentano caratteri di variabilità allinterno di un collettivo di riferimento (popolazione statistica) costituito da unità statistiche elementari

8 Finalità e caratteristiche del metodo statistico Sviluppo tecnico scientifico in campo medico Evoluzione economico-sociale del Paese Nuovi problemi ed esigenze nei Servizi sanitari Nuova figura di operatore sanitario

9 Capacità richieste Loperatore sanitario deve acquisire capacità per Identificare formulare rendere operativi i metodi per soddisfare le nuove necessità sanitarie Pianificare - organizzare - erogare - valutare i servizi (prevenzione, cura educazione sanitaria) Partecipare alla ricerca

10 Come raggiungere questi obiettivi Studiare le malattie e le loro cause Osservare levoluzione delle malattie e dei bisogni dei pazienti Interpretare i fenomeni e modificare modalità operative ed organizzative Acquisire spirito critico per valutare i risultati Assumere decisioni per ottimizzare le prestazioni erogate È importante lapproccio quantitativo ai problemi sanitari

11 La Statistica Insegna ad utilizzare il metodo scientifico per raccogliere,organizzare linformazione favorendo la comprensione dei fenomeni naturali Fornisce una serie di metodi per dare un valore oggettivo e generale alle esperienze attraverso la quantificazione dei fenomeni

12 Popolazione e unità statistiche Linsieme di tutti gli elementi che si vogliono osservare rispetto a un dato fenomeno si definiscono universo statistico o popolazione I singoli elementi della popolazione si chiamano unità statistiche Possono essere: semplici ( singoli individui, incidenti domestici …) composte ovvero aggregati di unità semplici (famiglie, classi scolastiche)

13 Le grandi aree della Statistica(1) Statistica Descrittiva Metodo deduttivo (dal generale al particolare) Raccolta dei dati Sintesi dei dati di un campione Presentazione dei risultati (analisi esplorativa)

14 Le grandi aree della Statistica(2) Statistica inferenziale Metodo induttivo (dal particolare al generale) Rilevazioni parziali (campioni rappresentativi) Stima dei parametri di una popolazione ignota Verifica delle ipotesi

15 Caratteri e modalità Data una popolazione, si definisce carattere una particolare caratteristica che si presenta in ciascun elemento della popolazione in forme differenti o modalità Studiare una popolazione secondo un dato carattere significa osservare come si distribuiscono in essa le modalità del carattere esaminato Le modalità del carattere in esame devono essere incompatibili ed esaustive: ciascun elemento della popolazione presenta una e una sola delle modalità del carattere in esame

16 I caratteri statistici Un insieme di unità statistiche può essere descritto secondo uno o più caratteri selezionati in funzione degli obiettivi della ricerca (sesso, età, statura, salute....) Lattribuzione di una modalità (classificazione delle unità statistiche) porta alla formazione del dato statistico Una distribuzione statistica è linsieme delle modalità che un carattere presenta in un insieme N di unità statistiche

17 Classificazione dei caratteri Quantitativi (variabili) Caratteri le cui modalità sono misurabili ( a ciascuna corrisponde un numero che esprime una misura) Continuo (possono assumere qualunque valore tra due valori dati) Pressione sanguigna Altezza,( 1,60.. 1,65- 1,66…1,70) peso ( , , ) Discreto (possono assumere solo alcuni valori) Numero bambini, numero attacchi asma alla settimana,... (n figli: possono essere 1, 2,3.. Non 1,4 o 2,5 !!)

18 Classificazione dei caratteri Qualitativi (mutabili) Caratteri le cui modalità non sono il risultato di misurazioni in senso fisico Ordinale (categorie ordinate) Stadio del cancro al seno; migliore- uguale- peggiore; non sono daccordo- neutro- sono daccordo. Sconnesso (categorie non ordinate) Sesso (maschio- femmina); vivo-morto; gruppo sanguigno 0,A,B,AB

19 Relazioni e operazioni fra le modalità CaratteriRelazioni e operazioni Qualitativi sconnessiuguaglianza e disuguaglianza Qualitativi ordinatiuguaglianza e disuguaglianza;ordinamento Quantitativiuguaglianza e disuguaglianza;ordinamento; addizione e sottrazione

20 CARATTERI E MODALITÀ Le modalità di ogni carattere sono selezionate in base alle unità statistiche in esame, alloggetto dello studio e alla scelta dellosservatore Carattere Modalità Sesso - maschio, femmina Colore occhi -marroni, verdi, celesti,scuri, chiari Statura -1,55 1,69 1,75 1,80 minore di 1,65, compreso tra 1,65 e 1,80 maggiore di 1,60..

21 Trasformazione dei caratteri Da quantitativi a qualitativi Statura in cm basso, medio, alto Pressione arteriosa in mm/Hg ipertensione moderata, lieve, grave La trasformazione può essere utile ma comporta una perdita di informazione

22 Classificazione dei caratteri statistici secondo il livello di misurazione Scale nominali Sono rappresentate da quei caratteri qualitativi le cui modalità non presentano alcun ordine di successione e senza relazione quantitativa tra esse (sesso, gruppo sanguigno,professione,...) Si possono formulare solo i giudizi: di uguaglianza di disuguaglianza

23 Classificazione dei caratteri statistici secondo il livello di misurazione Scale ordinali Sono rappresentate da quei caratteri qualitativi le cui modalità presentano un ordine di successione ma non una grandezza: Es: ordinamento di un gruppo di individui secondo un dato carattere Ordine crescente di: reddito, titolo di studio, stadio di una malattia...

24 Classificazione dei caratteri statistici secondo il livello di misurazione Scale ad intervalli Sono rappresentate da caratteri quantitativi disposti in una scala ordinale in cui è possibile misurare la distanza tra di essi espressi in valori singoli o in classi di valori (lunghezza, statura, peso,....)

25 Le classificazioni di caratteri e scale Terminologia italianaTerminologia anglosassone Carattere qualitativo sconnesso Scala nominale Carattere qualitativo ordinatoScala ordinale Carattere quantitativoScala di intervalli

26 Esempio Un gruppo di studenti è stato classificato secondo alcune informazioni NE = quantitativo discreto V = quantitativo Val = qualitativo ordinato CL = qualitativo sconnesso studenteN esami votovalutazioneCondizione lavorativa 1224buonolavoratore 2118sufficientelavoratore 3230ottimonon lavoratore 4128ottimolavoratore 5120sufficientenon lavoratore 6324buonolavoratore

27 Raccolta e organizzazione dei dati

28 Le fasi delle ricerca Definizione del problema Formulazione del disegno di ricerca Raccolta dei dati Valutazione della qualità del dato Elaborazioni statistiche Interpretazione dei risultati Corso di Statistica

29 Definizione del problema Si stabiliscono gli obiettivi della ricerca Si definisce il fenomeno Si sceglie la popolazione in cui il fenomeno si manifesta Si individuano le caratteristiche della popolazione che interessano lo studio. Corso di Statistica

30 Il disegno della ricerca Definizione delle risorse Il tipo di indagine da effettuare La definizione delle ipotesi La consultazione bibliografica I metodi di rilevazione Gli strumenti da utilizzare Laddestramento degli addetti alla rilevazione Il pre-test (indagine pilota) Corso di Statistica

31 INDAGINE STATISTICA Su tutta la popolazione (censimento famiglie italiane) Su un campione della popolazione statistica (indagine campionaria) Indagine statistica Raccoglie e analizza i dati Statistica descrittiva Trarre indicazioni sullintera popolazione (descrivere il fenomeno) Statistica inferenziale Trarre indicazioni dal campione che siano valide per lintera popolazione

32 I dati e le statistiche I dati possono essere: Primari: se raccolti direttamente dal ricercatore È sufficiente utilizzare semplici schede di registrazione sulle quali riportare i dati di interesse o in caso di banca dati acquisire il file dati del fenomeno che interessa Secondari se ricavabili da una rilevazione già effettuata (Fonti statistiche esistenti es. dati ufficiali, rilevazioni periodiche..)

33 Rilevazione di dati Nel caso di dati provenienti da indagine programmata è necessario predisporre un questionario Diretto Compilato dallintervistato Indiretto Compilato dal ricercatore o dallintervistatore

34 IL QUESTIONARIO regole per la stesura I Le finalità del questionario devono essere precise e limitate per garantire logicità e razionalità alla struttura del questionario Il tempo di somministrazione dovrebbe essere sufficientemente limitato

35 IL QUESTIONARIO regole per la stesura II Le domande devono essere: Univocamente comprensibili e non orientate Relative ad un solo aspetto Possibilmente precodificate Poste in sequenza (dai quesiti semplici a quelli più complessi) In numero limitato (essenziali)

36 QUALITÀ DEL DATO Valutare sempre i criteri adottati nella raccolta e le finalità della rilevazione Esempio: tipo di colloquio operatore statistico Operatore: ho raccolto 300 cartelle sono molte quale indagine posso fare? Statistico: 300 cartelle sono tante.... Ma rispetto a cosa? Qual è luniverso di riferimento? Cosa intendevi studiare? Quale ipotesi di lavoro hai fatto?

37 CONTROLLO E VERIFICA DEI DATI Gli errori possono essere: Sistematici:quando si presentano nella stesa maniera per ogni dato rilevato (es. strumento di misura non preciso) Accidentali: si verificano irregolarmente e con modalità differenti (es. trascrizione dati) Casuali : derivanti da fattori non conosciuti e e non controllabili Accertare presenza/assenza di errori prima dello spoglio dei dati

38 Verifica dellattendibilità dei dati Controllo compatibilità Evidenzia eventuali errori di contraddizione confrontando 2 o più dati riguardanti la stessa unità statistica e /o lo stesso /i aspetto/i legati logicamente tra loro (età vs anno di nascita) Controllo di coerenza o congruità verifica se il dato rilevato rientra nel campo di definizione del fenomeno (età 0 – 100) Controllo di qualità si basa sui concetti di validità (accuratezza) e di precisione(riproducibilità) un dato è tanto più valido quanto meno si discosta dal valore medio reale del fenomeno tanto più è preciso quanto meno si differenzia da altri valori rilevati (concordanza tra rilevazioni ripetute dello stesso fenomeno)

39 Il concetto di popolazione statistica Linsieme di tutti gli elementi (unità statistiche) che posseggono il carattere esaminato costituisce luniverso o la popolazione statistica Le unità statistiche possono appartenere a più popolazioni ES : maschio adulto popolazione Ipertesi coniugati ricoverati Paziente ricoverato unità statistica Cartella clinica Insieme di variabili (caratteri)

40 Organizzazione dei dati I dati rilevati vengono trascritti Talvolta è necessaria la trasformazione in codici (simboli alfanumerici) Lo spoglio dei dati classificare ciascuna unità statistica in base alla modalità rilevata Es: 25 soggetti in base al gruppo sanguigno Rilevazione : A,B,B,0,0,AB,0,A,A,0,0,B,AB,A,A,0,0,A,AB,B,,B,0,B,AB Prospetto: 0 IIIIIIII A IIIIIII Modalità B IIIIII AB IIII Frequenze osservate

41 Classificazione di una popolazione per modalità o per frequenze Si cercano quale modalità dei caratteri considerati è presente in ciascuna delle unità statistiche della popolazione e raggruppando (contando) le unità che si presentano con modalità uguali (frequenze)

42 Frequenza e distribuzioni di frequenza Per frequenza si intende il numero di volte che si è manifestato un fenomeno Una distribuzione di frequenze fa riferimento al complesso di dati rilevati unendo quelli con le stesse caratteristiche Per ogni modalità del carattere osservato (statura, sesso,..) per frequenze assolute (n i ) si intende il numero delle unità nelle quali il carattere presenta la stessa modalità i -ma

43 Tabella di dati grezzi qualitativi soggettofumatoresoggettofumatoresoggettofumatore 1 si 11 si 21 si 2 no 12 si 22 no 3 si 13 no 23 si 4 14 si 24 si 5 no 15 si 25 no 6 si 16 si 26 no 7 si 17 no 27 si 8 no 18 si 28 si 9 no 19 no 29 si 10 no 20 no 30 si

44 Spoglio dei dati rispetto alla variabile fumo ModalitàSpoglio dei datiFrequenze FumatoriIIII IIII IIII III 18 Non fumatoriIIII IIII II II 12 totaleIIIIIIIIIIIIIIIIIIIIII IIIIIIIIIIIIIIIIII 30

45 Distribuzioni di frequenze Se la distribuzione di frequenze è fatta per un solo carattere, la distribuzione è definita semplice Se i caratteri rispetto ai quali è fatta la distribuzione sono due, tre …. m, la distribuzione di frequenza sarà doppia, tripla,….multipla

46 La matrice dei dati I dati codificati in una in una rilevazione statistica su n unità statistiche studiando x variabili sono raccolti in forma di tabella (matrice di dati) NsessoEtà (anni) Peso (Kg) Titolo di studio n.° ricoveri 1M4283laurea2 2F4865diploma n F 6179Licenza media inferiore 4

47 La matrice dei dati Ogni riga corrisponde ad una unità statistica NsessoEtà (anni) Peso (Kg) Titolo di studio n.° ricoveri 1M4283laurea2 2F4865diploma n F 6179Licenza media inferiore 4

48 La matrice dei dati Ogni colonna rappresenta una variabile NsessoEtà (anni) Peso (Kg) Titolo di studio n.° ricoveri 1M4283laurea2 2F4865diploma n F 6179Licenza media inferiore 4

49 Analisi ed elaborazione statistica dei dati Sintesi dei dati Tabelle frequenze (distribuzioni di frequenze) Indici statistici Per sintetizzare un caratterePer confrontare diverse situazioni

50 50 unità classificate secondo la statura

51 Distribuzione in classi In presenza di un carattere con molte modalità è possibile (è conveniente!) formare delle classi di valori Ne deriverà una variabile statistica divisa per intervalli o classi di frequenza In ciascuna delle classi si raccolgono tutte le osservazioni che cadono al suo interno I dati così organizzati costituiscono una distribuzione di frequenze definita distribuzione in classi

52 Distribuzione in classi I valori minimo massimo della classe si definiscono limiti di classe: limiti inferiori e limiti superiori Statura in cm frequenze assolute (classi) n i 140 – – – – – Ciascuna coppia di limiti costituisce lintervallo della classe

53 Distribuzione in classi Statura in cm frequenze assolute (classi) n i 140 – – – – – Il valore centrale di una classe è dato dalla semisomma degli estremi limite inferiore + limite superiore 2

54 Criteri per costruire una distribuzione in classi Identificare il campo di variazione (differenza tra il valore più grande e il più piccolo) Suddividere il campo di variazione in un numero conveniente di classi secondo la numerosità dei dati Una tabella con un numero elevato di classi è troppo simile alla tabella di origine dei dati; una con poche classi, eccessivamente ampie, fa perdere troppe informazioni Gli intervalli di classe dovrebbero avere la stessa ampiezza Lobiettivo della divisione in classi è una migliore leggibilità della tabella senza perdere troppe informazioni

55 Distribuzione di frequenza di 50 unità classificate secondo la statura Statura in cm. Unità statistiche frequenze assolute (in classi) n i II IIIIIIIII IIIIIIIIIIIIIIIII IIIIIIIIIIII IIIIIIII II 2

56 Frequenza, distribuzioni di frequenza II La somma delle frequenze assolute è = al totale N delle unità del collettivo Oltre le frequenze assolute si considerano le frequenze relative indicano il rapporto tra la frequenza assoluta della modalità i –ma e il numero totale N La somma di tutte le frequenze relative di tutte le modalità in cui si articola il carattere considerato è =1 (o a 100 se le frequenze relative sono espresse in percentuali)

57 Distribuzione di frequenza di 50 unità classificate secondo la statura Statura in cm. frequenze assolute frequenze relat. Frequenze % (in classi) n i

58 Distribuzione di frequenza variabile qualitativa Colore degli occhi Frequenza Assoluta Relativa Percentuale n i f i % Modalità Castani Azzurri Verdi Totale(Σ i ) Frequenze relative = frequenze assolute totale Frequenze percentuali = frequenze relative x 100

59 Uso di frequenze percentuali(1) In presenza di osservazioni di più caratteri contemporaneamente si possono calcolare più frequenze relative e percentuali Si possono dare interpretazioni errate se non si definisce accuratamente il denominatore Es: la frequenza % delle donne che fumano può essere calcolata in riferimento al totale delle donne, in relazione al totale dei fumatori, al totale dei soggetti esaminati La frequenza assoluta delle donne fumatrici (numeratore) è sempre la stessa. Il denominatore cambia in base ad ogni possibile relazione

60 Uso di frequenze percentuali(2) Attenzione al significato che si attribuisce alle percentuali in presenza di una bassa numerosità delle frequenze! Piccole variazioni, probabilmente casuali, vengono sottolineate alterando il risultato ES: se mensilmente i ricoverati per una patologia passano da 4 a 5 e successivamente a 3, appare ingiustificato evidenziare variazioni percentuali sensibili rispettivamente di +25% e -40% Pur se esatto il calcolo matematico, statisticamente si attribuisce un eccesso di significato a banali fluttuazioni in un fenomeno che appare costante nel tempo

61 Variabile sesso Frequenze assolute (n ) matricole di Statistica Medicina M F Frequenze relative (f) matricole di Statistica Medicina M (16/33)=48.5% (33/125)=26,4% F (17/33)=51.5% (92/125)=83,6%

62 Variazioni percentuali EtàPeso prima Peso dopoVariazione % Paziente ,4 Paziente ,1 Paziente ,1 Paziente ,1 P f – P i / P i x – 58 / 58 x 100 = 3,4

63 Frequenze cumulate La frequenza cumulata (assoluta, relativa e percentuale) in corrispondenza di un valore X i indica il numero di volte che la variabile X ha assunto valori pari o inferiori a X i Frequenze assolute cumulate C 1 = N 1 C 2 = N 1 +N 2 C 3 =N 1 +N 2 +N C k = N 1 +N 2 +N N k

64 Distribuzione in classi:caratteristiche e quadro delle frequenze classePeso (Kg)x c ff % f cum f %cum I II III IV V VI VII Valori centrali x c (40+45)/2=42.5; (45+50)/2=47.5;.....; (70+75)/2=72.5 Ampiezza di classe c partendo dai confini: 45-40=5; 50-45=5;..... ; 75-70=5;

65 Più variabili rilevate per unità statistica Distribuzione di frequenza di 50 unità classificate secondo il sesso Sesso unità statistiche frequenze assolute n i Maschi IIIIIIIIII IIIIIIIIII III 23 Femmine IIIIIIIIII IIIIIIIIII IIIIIIII 27

66 Più variabili rilevate per unità statistica Distribuzione di frequenza di 50 unità classificati per sesso e statura Statura in cm. Sesso Totale Maschi Femmine Totale

67 Schema per tabella a due entrate Y X CARATTERE Y Totale riga y1y1 y2y2 y 3 …..y j …..ymym C A R A T E R E X x 1 f 11 f 12 f 13 …f 1j …f 1m F1F1 x2x2 f 21 f 22 f 23 …f 2j …. f 2m F2F2 x 3 …… f 31 f 32 f 33 …f 3j …f 3m F3F3 x i …. f j1 ….. f j2 ….. f j3 …. ….. f ij … ….. f im ….. F i …… xnxn f n1 f n2 f n3 …f nj...f nm FnFn Totale colonna F1F1 F2F2 F F.j......F.m F..


Scaricare ppt "Corso di statistica medica Prof.ssa Cinzia Leuter tel. 340 7149124."

Presentazioni simili


Annunci Google