per la Facoltà di Medicina e Chirurgia Università degli Studi di Palermo Insegnamento di “Statistica Medica” per la Facoltà di Medicina e Chirurgia a.a. 2011/2012 (3 cfu) Docente Dott.ssa Filippa Bono
Etimologia della parola “Statistica” Deriva dal vocabolo Italiano STATO Ghislini (1589): “la Statistica è la descrizione delle qualità che caratterizzano e degli elementi che compongono uno Stato
Le due anime della Statistica Risposta a un’esigenza conoscitiva Raccolta, Organizzazione e diffusione di dati statistici Constatazione che la realtà è variabile ma vi sono risultati che meritano più fiducia di altri perché si ripetono con maggiore regolarità Studio dell’incertezza come fattore immanente nella scienza, nella tecnica, nelle attività umane
Definizioni La Statistica ha come scopo la conoscenza quantitativa dei fenomeni collettivi. “La statistica è la disciplina che elabora i principi e le metodologie che presiedono alla rilevazione e alla raccolta dei dati, alla rappresentazione sintetica e all’interpretazione dei dati stessi e, laddove ve ne siano le condizioni, alla generalizzazione delle evidenze osservate” (Cicchitelli) E’ una scienza probabilistica. L’analisi statistica dei dati conduce a risultati che non sono certi ma sono molto vicini alla realtà, con un’approssimazione che si può calcolare.
Obiettivi del corso Introdurre le basi della metodologia statistica, indirizzando la conoscenza delle tecniche utilizzate ai problemi che si incontrano più frequentemente in ambito medico-sanitario Sarà illustrata la metodologia statistica descrittiva per il trattamento e l’elaborazione statistica dei dati, per giungere a svolgere autonomamente analisi statistiche descrittive e saper interpretare i risultati ottenuti. Saranno introdotti la teoria della probabilità, il campionamento statistico e gli aspetti relativi alla statistica inferenziale con applicazioni all’ambito medico-sanitario.
Di che cosa si occupa la statistica medica? Misurare l’efficacia di nuovi test, procedure e terapie Individuare categorie di pazienti che possono trarre il maggior giovamento da una terapia, evitando di sottoporre i pazienti non idonei a potenti farmaci e a pesanti effetti collaterali Valutazione di efficienza ed efficacia dei servizi sanitari: Efficacia attesa: Capacità potenziale di un intervento di modificare in modo favorevole le condizioni di salute dei pazienti cui è rivolto quando viene applicato in modo ottimale Efficacia osservata: Risultati ottenuti dall’applicazione di routine dell’intervento Efficienza: Capacità di raggiungere risultati in termini di salute con il minimo impiego di risorse 4. Fornire gli strumenti necessari per l’uso della letteratura scientifica nella medicina clinica (Evidence-based medicine)
A cosa servono i metodi della biostatistica - Prima che un nuovo farmaco possa essere commercializzato la casa farmaceutica richiede che venga sottoposta a un clinical trial: uno studio sperimentale condotto sull’uomo L’obiettivo è quello di verificare l’efficacia del farmaco e gli effetti collaterali - Le decisioni del governo degli Stati Uniti sono in parte basate sulle previsioni relative alla longevità della popolazione Dove investire le risorse pubbliche per ridurre la mortalità infantile? Quali fattori aumentano in un soggetto la probabilità di sviluppare malattie coronariche?
Biostatistica di Wayne W. Daniel, Edises edizione 2010 Libri di testo Biostatistica di M. Pagano, K. Gauvreau, II Ed. italiana a cura di I.F. Angelillo, M. Pavia, P. Villari, Ed. IDELSON-GNOCCHI oppure Biostatistica di Wayne W. Daniel, Edises edizione 2010
Statistica descrittiva e inferenza La statistica descrittiva fornisce gli strumenti per sintetizzare ed esplicitare in forma corretta il modo in cui il fenomeno si è manifestato nel collettivo osservato Mediante l’inferenza statistica è possibile misurare e controllare l’attendibilità delle informazioni provenienti da un campione estrazione del campione
Carattere statistico Carattere statistico: è la caratteristica con cui si presenta un’unità nel collettivo di riferimento. Es. unità statistica=paziente: età, sesso, colesterolo sierico, tipo di terapia. In genere, su un determinato collettivo si osservano più caratteri che possono essere studiati singolarmente o in modo congiunto (studio delle relazioni)
Modalità di un carattere Ciascun carattere statistico si articola in “modalità” qualitative e quantitative, che sono i modi in cui un carattere si presenta nelle unità del collettivo. La modalità qualitativa è espressa in termini nominali, categorie, attributi. La modalità quantitativa è espressa da numeri. Es. sesso: maschio, femmina titolo studio: senza titolo, scuola elementare, scuola media inferiore,… Gruppo sanguigno: A, B, 0 Spesa sanitaria Colesterolo sierico, glicemia, statura, diametro della lesione in mm
Un esempio di dati osservati Nome Età Sesso Titolo di studio Attività Peso (kg) Punteggio esercizi Rossi M. 32 M laurea occupato 72 65 Bianchi G. 39 F 55 Nicoletti C. 46 diploma disoccupato 79 53 Marcelli F. 28 studente 63 78 Petrone A. 51 casalinga 64 21
CLASSIFICAZIONE DEI CARATTERI STATISTICI
Rilevazioni: Sperimentali/osservazionali (Medicina, Fisica, Chimica) Ipotesi di lavoro Possibilità di controllo Osservazionali (Indagini di mercato, sondaggi) Non si ha la possibilità di controllc Controllo Diretto dei Fattori Sperimentali e dei Fattori di Stratificazione Indiretto: Randomizzazione Indagine Statistica
Indagine statistica Indagine Totale Indagine Campionaria Fasi dell’indagine definizione degli obiettivi definizione delle unità e delle variabili da rilevare scelta del periodo di riferimento individuazione della popolazione e della lista delle unità statistiche definizione del piano di campionamento raccolta dei dati scelta della tecnica di rilevazione formulazione del questionario e pretest rilevazione sul campo registrazione dei dati registrazione su supporto magnetico controllo e correzione elaborazione e analisi dei dati
La rilevazione dei dati La raccolta delle informazioni può essere completa oppure parziale. È completa quando si esa-minano tutte le unità statistiche che compongono la popolazione oggetto di studio. Pregi: Accuratezza delle stime anche a livelli territoriali molto spinti Ricchezza delle informazioni raccolte Esaustività Difetti: Costo elevato Tempi di elaborazione dei dati molto lunghi Qualità dei dati non elevata È parziale quando ci si limita a studiare un sottoinsieme, detto “campione” dell’insieme di riferimento. Pregi: Continuità della rilevazione Economicità Indagini più mirate e approfondite Difetti: Riferimento territoriale non spinto Variabilità campionaria
CARATTERE QUANTITATIVO O VARIABILE Continuo: è un carattere le cui modalità possono assumere, in linea di principio, qualsiasi valore contenuto in un intervallo reale. Discreto: è un carattere le cui modalità possono essere poste in corrispondenza con l’insieme dei numeri naturali {1, 2,3,..} o un suo sottinsieme proprio. Per i caratteri quantitativi possono prendersi come modalità delle classi
DIVISIONE IN CLASSI DI UN CARATTERE CONTINUO Si individuano il minimo e il massimo dei nostri dati Si sceglie un adeguato numero di classi (si può usare la formula di Sturges k=1+3.322*log10 (n), dove n è la numerosità del data-set) Si calcola il range= massimo-minimo Si determina l’ampiezza della classe a=Range/k. La prima classe avrà estremi [minimo;minimo+a]
Esercizio: Determinare la distribuzione di frequenza in 5 classi di uguale ampiezza e costruire il grafico classi frequenze ≤0.2 7 0.2-|0.35 2 0.35-|0.5 1 0.5-|0.65 0.65-|0.80
MISURAZIONE DEI CARATTERI STATISTICI Carattere Esempi Qualitativo sconnesso sesso, guarigione (SI/NO), causa di morte Ordinato rettilineo Anno di nascita, anno di corso, sintomatologia, qualità di un’immagine Ordinato ciclico Giorno della settimana, mese dell’anno Quantitativo discreto Numero di figli, numero di carie, numero di aborti, numero di noduli di una lesione cancerosa continuo Peso, statura, colesterolo, glicemia
proprietà di misura sulla scala Classificazione dei caratteri rispetto al livello di misurazione 1) Nominale o classificatoria Aumentano le proprietà di misura sulla scala 2) ordinale o per ranghi 3) ad intervalli 4) di rapporti
Scala nominale Esiste solo una sola relazione: l’identità Scala nominale: quei caratteri qualitativi le cui modalità non presentano un ordine di successione e senza nessuna relazione quantitativa. Esiste solo una sola relazione: l’identità Operazione ammessa il conteggio (es.: numero di pazienti che guariscono)
Scala ordinale Scala ordinale: quei caratteri qualitativi le cui modalità presentano un ordine di successione ma non una grandezza. Classificazione BI-RADS
Ordinale o per ranghi limite Non solo uguaglianza o diversità ma anche... gradazione tra le classi o tra individui di classi differenti Relazione d’ordine è asimmetrica e transitiva In una scala ordinale, non è possibile quantificare le differenze di intensità tra le osservazioni. limite
Scala a intervalli Scala a intervalli: rappresentata da caratteri quantitativi le cui modalità sono espresse da numeri e consentono dunque di misurare la distanza tra esse. Non hanno uno zero assoluto, naturale e non arbitrario. QI (quoziente intelligenza) A 25 B 50 B-A B è più intelligente di A, ma non posso fare il rapporto e dire che B è il doppio intelligente di A (50:25=2) Il rapporto tra le distanze su una scala è uguale al rapporto tra le distanze su un’altra scala (es. Scala Celsius o Fahrenheit)
Scala di rapporti Scala di rapporti: rappresentata da caratteri quantitativi le cui modalità sono metriche, consentendo il calcolo di rapporti tra le unità rispetto ai valori del carattere Esiste uno zero assoluto, naturale e non arbitrario Classi di spesa sanitaria Meno di 4 (mila euro) 4|-10 10|-25 25|-50 50|-100 100 e oltre Età Meno di 5 6-10 11-20 21-40 41-70 Oltre 70 Lo zero assoluto è la temperatura più bassa che teoricamente si possa ottenere in qualsiasi sistema macroscopico, e corrisponde a 0 Kelvin (–273,15 °C; –459,67 °F). La scala Kelvin è scala di rapporti! Il rapporto tra le misurazioni su una scala è uguale al rapporto tra le misurazioni su un’altra scala (es. Scala Kilogrammi e Libbre)
Scalogramma di Guttmann Nominale Ordinale Intervallo Rapporti Identità + Ordinamento Differenze
Rappresentare le variabili in un foglio excel Variabile discreta Scala nominale Scala ordinale Variabile continua Scala ordinale