“Sabina Universitas” - Università degli Studi di Roma “La Sapienza” Appunti dalle Lezioni di Statistica Medica per Tecnici della Prevenzione “Sabina Universitas” - Università degli Studi di Roma “La Sapienza” Gianluca Fovi De Ruggiero, MD PHD Anno Accademico 2017- 2018
Gianluca Fovi De Ruggiero MD, PhD (g.fovideruggiero@asl.rieti.it) Medico Chirurgo Dirigente Medico ASL Rieti Specialista in Igiene e Medicina Preventiva, (indirizzo Epidemiologia e Sanità Pubblica) Specialista in Statistica Sanitaria, (indirizzo Programmazione Socio-Sanitaria) Master di II° Livello in Epidemiologia Executive Master in Medicina della Migrazione e delle Diseguaglianze Perfezionamento Universitario in Sanità Pubblica Dottore di Ricerca in Medicina Preventiva e Sanità Pubblica, XX° Ciclo Docente a Convenzione “Sabina Universitas/Università de “La Sapienza” G.F.D.R - a.a. 2016-2017
La parola "Statistica" deriva dal vocabolo italiano "Stato" e fa riferimento, nella quasi totalità dei linguaggi europei, alla constatazione per cui le prime informazioni su fenomeni reali sono state raccolte ed organizzate ad opera degli organismi statali che ne erano anche i principali utilizzatori. Esistono altre versioni circa la derivazione etimologica di "Statistica", come quella che fa riferimento a (2) status, per indicare che tale scienza esamina la situazione contingente della realtà oppure al latino (3) statera (= bilancia), al tedesco (4) Stadt (= città). Anche se convincenti sul piano logico-concettuale, queste derivazioni non trovano riscontri storici obiettivi se paragonati all'uso crescente del termine "Statistica" inteso come raccolta di informazioni organizzate e gestite dallo "Stato". La prima apparizione del vocabolo "statistica" in questa accezione sembra essere quella dell'italiano Ghislini che, nel 1589, indica la Statistica come "descrizione delle qualità che caratterizzano e degli elementi che compongono uno Stato". G.F.D.R - a.a. 2016-2017
Statistica descrittiva Statistica inferenziale La Statistica è una scienza di derivazione matematica che si occupa di studiare e descrivere la realtà fenomenica nei suoi aspetti di rilevazione numerica. Deriva pertanto le sue regole e le sue valutazioni qualitative attraverso l'analisi di rilevamenti quantitativi opportunamente selezionati. La metodologia statistica viene suddivisa tradizionalmente in due branche strettamente collegate: Statistica descrittiva Statistica inferenziale 1. La prima ha a oggetto indicatori statistici (indicatori di posizione, di variazione, di concentrazione, di correlazione, ecc.) per riassumere con pochi numeri (media, varianza, ecc.) realtà anche complesse. 2. La statistica inferenziale ha come obiettivo di fare affermazioni valide anche per fenomeni che non sono stati osservati, generalizzando i risultati a partire dal dato empirico; studia inoltre la verifica di ipotesi. Per fare ciò ricorre agli strumenti della teoria della probabilità. G.F.D.R - a.a. 2016-2017
La statistica descrittiva è la branca della Statistica che studia i criteri di rilevazione, di classificazione e di sintesi delle informazioni relative a una popolazione oggetto di studio. La statistica descrittiva raccoglie le informazioni sulla popolazione o su una parte di essa (campione) in distribuzioni, semplici o complesse (almeno due caratteri), e sintetizza attraverso famiglie di indici: valori medi, indici di variabilità, indici di forma, rapporti statistici, relazioni statistiche; i risultati ottenuti in tal modo si possono definire certi, a meno di errori di misurazioni, che essendo dovuti al caso, in media, si annullano per definizione. G.F.D.R - a.a. 2016-2017
L'inferenza statistica è il procedimento per cui si deducono le caratteristiche di una popolazione dall'osservazione di una parte di essa, detta campione selezionata mediante un esperimento casuale (aleatorio). Si considereranno principalmente campioni casuali semplici di dimensione n > 1 che possono venire interpretati come n realizzazioni indipendenti di un esperimento di base, nelle medesime condizioni. G.F.D.R - a.a. 2016-2017
La capacità di partecipare alla ricerca Perché un corso di Statistica Medica per la formazione del Tecnico della Prevenzione (TdP)? Per pianificare, organizzare, dispensare e valutare il proprio lavoro (prevenzione, educazione, ispezione etc..) La capacità di partecipare alla ricerca La capacità di contribuire alla promozione di una politica sanitaria efficiente G.F.D.R - a.a. 2016-2017
Una serie statistica si compone di un insieme di valori numerici ricavati dall’osservazione
La prima fase del lavoro statistico consiste nel (1)classificare i risultati ottenuti, (2)presentarli in una forma facilmente accessibile (che ne dia tuttavia una descrizione il più fedele possibile)
Numero di figli maschi (x) Distribuzione dei figli maschi in 1877 famiglie Numero di figli maschi (x) Numero di famiglie (f) Frequenze relative (fi) Percentuali (f%) 21 0,011 1,1 1 111 0,059 5,9 2 287 0.153 15,3 3 480 0,256 25,6 4 529 0,282 28,2 5 304 0,162 16,2 6 126 0,067 6,7 7 19 0,010 1,0 Totale 1877 1,000 100,0
Frequenze Assolute (f) Frequenze Relative (fi) Distribuzione dei pesi di 100 adulti di sesso femminile CLASSI (X) Frequenze Assolute (f) Frequenze Relative (fi) Percentuali (f%) 40-44 5 0,05 5,0 45-49 12 0,12 12,0 50-54 31 0,31 31,0 55-59 60-64 16 0,16 16,0 65-69 3 0,03 3,0 70-74 2 0,02 2,0 Totale n=100 1,00 100,0
Distribuzione dei pesi di 100 adulti di sesso femminile Ampiezza di classe ESTREMI Limiti Reali Valore Centrale Frequenza 40-44 39,5-44,5 42 5 45-49 44,5-49,5 47 12 50-54 49,5-54,5 52 31 55-59 54,5-59,5 57 60-64 59,5-64,5 62 16 65-69 64,5-69,5 67 3 70-74 69,5-74,5 72 2 Totale 100,0
L’effettivo di una osservazione (o di una classe), N, rappresenta la sua FREQUENZA ASSOLUTA
Se desideriamo confrontare tra loro serie statistiche che comprendono un diverso numero di elementi, conviene dividere la frequenza “ni” per il numero dei casi totali (frequenza assoluta, N). In tal caso si parla di frequenza relativa (fi)
Pertanto: ∑ ni = N ∑ fi = 1
La tabella di cifre che descrive una distribuzione di frequenze può essere sostituita da una rappresentazione grafica che ci fornisce una immagine più “immediata” della distribuzione di frequenze stessa, giacché permette di coglierne subito l’andamento generale e le caratteristiche essenziali. È questo il DIAGRAMMA DELLE FREQUENZE
I rettangoli dell’ISTOGRAMMA hanno la stessa base e le altezze, e di conseguenza le superfici, proporzionali alle frequenze assolute di ciascun valore o classe
Principali tipi di diagramma di frequenza Diagramma simmetrico Diagramma asimmetrico (distribuzione binomiale) Diagramma a J (Iperbolico) Distribuzione Bimodale Poligono delle frequenze Diagramma delle frequenze cumulate
Distribuzione dei diametri di 100 conchiglie di Cepaea nemoralis
Distribuzione per età dei morti per scarlattina in Inghilterra nell’anno 1933
Età di comparsa della ginecomastia in 98 soggetti Geller & Amalric)
Congiungendo i punti centrali delle ORDINATE MASSIME di ciascuno dei rettangoli dell’ISTOGRAMMA che rappresenta una serie di frequenze si ottiene una linea spezzata detta POLIGONO DELLE FREQUENZE della serie corrispondente, che indica in che modo varia la frequenza nell’insieme dei valori della serie
Frequenza Cumulata Tabella delle frequenze cumulate (tipo “fino a”) Numero di figli maschi (x) Numero di Famiglie (f) Numero cumulato di figli maschi (xc) Numero cumulato di famiglie (∑f) 21 1 111 Da 0 a 1 132 2 287 Da 0 a 2 419 3 480 Da 0 a 3 899 4 529 Da 0 a 4 1428 5 304 Da 0 a 5 1732 6 126 Da 0 a 6 1858 7 19 Da 0 a 7 1877 Totale
Frequenza Cumulata Tabella delle frequenze cumulate (tipo “maggiore di”) Numero di figli maschi (x) Numero di Famiglie (f) Numero cumulato di figli maschi (xc) Numero cumulato di famiglie (∑f) 7 19 6 126 6 o più 145 5 304 5 o più 449 4 529 4 o più 978 3 480 3 o più 1458 2 287 2 o più 1745 1 111 1 o più 1856 21 0 o più 1877 Totale
Variabili Qualitative Colore dei capelli Frequenze assolute Frequenze relative Percentuali Biondi 2829 0,4160 41,60 Castani 2632 0,3871 38,71 Neri 1223 0,1798 17,98 Rossi 116 0.00171 1,71 Totale n =6800 1,000 100,00
Gianluca Fovi De Ruggiero
Gianluca Fovi De Ruggiero
Gianluca Fovi De Ruggiero
Gianluca Fovi De Ruggiero Regola di Sturges Ampiezza Gianluca Fovi De Ruggiero
Gianluca Fovi De Ruggiero
Gianluca Fovi De Ruggiero
Gianluca Fovi De Ruggiero Diagramma a Punti Gianluca Fovi De Ruggiero
Gianluca Fovi De Ruggiero IDEOGRAMMA Gianluca Fovi De Ruggiero
Gianluca Fovi De Ruggiero Diagramma a Nastri Gianluca Fovi De Ruggiero
Gianluca Fovi De Ruggiero Diagramma a Colonne Gianluca Fovi De Ruggiero
Gianluca Fovi De Ruggiero Diagramma a Torta Gianluca Fovi De Ruggiero
Gianluca Fovi De Ruggiero Diagrammi a Bastoni Gianluca Fovi De Ruggiero
Gianluca Fovi De Ruggiero Poligono di frequenza Gianluca Fovi De Ruggiero
Gianluca Fovi De Ruggiero Istogramma Gianluca Fovi De Ruggiero
Gianluca Fovi De Ruggiero Misure di variabilità o dispersione Gianluca Fovi De Ruggiero
Gianluca Fovi De Ruggiero Campo di variazione o Range Gianluca Fovi De Ruggiero