Corso di statistica medica

Slides:



Advertisements
Presentazioni simili
- le Medie la Moda la Mediana
Advertisements

I dati Qualsiasi contenuto dell’esperienza.
RILEVAZIONE E RACCOLTA DATI
Monitoraggio e valutazione dei servizi formativi
SIMEU VI Congresso Nazionale, Rimini novembre 2008
METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI
La divulgazione della statistica
STATISTICA descrittiva
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Sintesi dei dati La sintesi dei dati comporta una perdita di informazioni, deve quindi essere privilegiato l’indice di sintesi che minimizza la perdita.
LA STATISTICA By prof. Pietro Rossi.
Lez. 3 - Gli Indici di VARIABILITA’
Gli errori nell’analisi statistica
Gli indicatori semplici Costituiscono un ponte tra ciò che è osservabile e misurabile e i concetti di cui si vuole fornire una misura. Assumono significato.
Progetto Pilota 2 Lettura e interpretazione dei risultati
Elementi di STATISTICA DESCRITTIVA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia l’analisi statistica.
Obiettivi del corso di Statistica Medica.
Le analisi per singolo item
COSA VUOL DIRE FARE STATISTICA
Canale A. Prof.Ciapetti AA2003/04
Metodi di ricerca in Psicologia
Metodi della ricerca in Psicologia
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
Il fumo di sigaretta in Provincia di Trento
Cap. 2 Definizioni e notazione (simboli) di base
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Statistica sociale Modulo A
VARIABILI E DISTRIBUZIONI DI FREQUENZA
Misurazione Le osservazioni si esprimono in forma di misurazioni
Questionari sulla didattica: le risposte di studenti & docenti.
PRESENTAZIONE REALIZZATA DA TANIA MILLI E ALTEA PROCACCI INDICE
Cai Lin Lin Michela & Guidetti Emanuela presentano:
METODI E CONTROLLI STATISTICI DI PROCESSO
Statistica descrittiva
C ONCETTI B ASE DI S TATISTICA. C ONCETTI BASE DI S TATISTICA WWW. CENTROSTUDIGORGIA. COM La statistica studia i fenomeni ripetibili del mondo con determinazione.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
LA SINTESI STATISTICA Una serie di dati numerici è
DIPARTIMENTO DI MEDICINA MOLECOLARE
I principali tipi di grafici
Corso di statistica medica
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Sintesi della lezione Il concetto di variabilità Campo di variazione Differenza interquartile La varianza La deviazione standard Scostamenti medi VARIABILITA’
C. Volendo organizzare attività, seminari ed incontri per la settimana dello studente, il comitato organizzatore affida alla classe I F un monitoraggio.
AUTOVALUTAZIONE D’ISTITUTO
AUTOVALUTAZIONE D’ISTITUTO
Statistica La statistica è
Gli indici di dispersione
Variabili temporali Analisi statistica
La statistica.
La vecchiaia di successo: prevenzione lavoro e stili di vita Aspetti economici e sociali Giorgio L. Colombo Università degli Studi di Pavia, Facoltà di.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Nucleo: Dati e previsioni
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
ORIENTAMENTO CONSAPEVOLE
Medicina sociale … Prof. Giovanna Tassoni Istituto di Medicina legale – Università degli Studi di Macerata.
A.A STATISTICA E CALCOLO DELLE PROBABILITA’ Docenti: Stefania Mignani Maurizio Brizzi.
NB: La lettura delle slide è solo un supporto allo studio che non sostituisce i testi di esame Metodi e tecniche della ricerca sociale - Prof. Flavio Ceravolo.
ANALISI E INTERPRETAZIONE DATI
Cos’è la ricerca sociale? La raccolta di informazioni relative ad una realtà, ad un fenomeno sociale secondo obiettivi specifici:
Corso di statistica medica Prof.ssa Cinzia Leuter
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
Ipotesi operative TeoriaEsperienza diretta e/o personale Quesito Piano esecutivo Scelta popolazione Scelta strumenti Scelta metodi statistici Discussione.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
STATISTICA P IA F ONDAZIONE DI C ULTO E R ELIGIONE C ARD. G. P ANICO Azienda Ospedaliera CORSO DI LAUREA IN INFERMIERISTICA Sr. Margherita Bramato.
DEFINIZIONE. La statistica è la disciplina che si occupa della raccolta di dati quantitativi relativi a diversi fenomeni, della loro elaborazione e del.
Presentare i dati Corso in Fonti, metodi e strumenti per l’analisi dei flussi turistici A.A Prof.ssa Barbara Baldazzi Corso di Laurea PROGEST.
Transcript della presentazione:

Corso di statistica medica Prof.ssa Cinzia Leuter cinzia.leuter@cc.univaq.it tel. 340 7149124

Testi consigliati T.Colton, Statistica in medicina Piccin Padova E.Ballatori, Statistica e metodologia della ricerca Margiacchi Editore F.Di Orio, Igiene epidemiologia e statistica, Masson Milano P.Lantieri, D.Risso,G.Ravera, Statistica medica per le professioni sanitarie, McGraw-Hill Milano

La Statistica definizione Analisi quantitativa delle osservazioni di un qualsiasi fenomeno soggetto a variazioni Raccolta e osservazione di dati per spiegarne i modelli di comportamento I metodi statistici consentono di effettuare analisi quantitative di un fenomeno le cui manifestazioni sono osservate attraverso unità di rilevazione

La Statistica La statistica è uno strumento Ha come obiettivi la descrizione,misurazione e la sintesi di un fenomeno Serve per verificare una ipotesi scientifica Descrive i fenomeni mettendone in luce le tendenze (fornisce indicazioni di tipo probabilistico)

Fenomeni collettivi fenomeni collettivi :sono quei fenomeni che la nostra mente non può conoscere con una sola osservazione, ma che invece apprende tramite la sintesi delle osservazioni di fenomeni più semplici, detti fenomeni individuali. Fenomeni collettivi mortalità natalità Fenomeni individuali morti nascite

L’attività statistica La progettazione del piano di ricerche L’organizzazione della rilevazione dei dati Lo spoglio e la classificazione delle informazioni raccolte La tabulazione dei dati L’analisi dei dati La sintesi delle informazioni attraverso opportuni parametri statistici

La disciplina statistica Oggetto della Statistica sono quei fenomeni che presentano caratteri di variabilità all’interno di un collettivo di riferimento (popolazione statistica) costituito da unità statistiche elementari

Finalità e caratteristiche del metodo statistico Sviluppo tecnico scientifico in campo medico Evoluzione economico-sociale del Paese Nuovi problemi ed esigenze nei Servizi sanitari Nuova figura di operatore sanitario

Capacità richieste L’operatore sanitario deve acquisire capacità per Identificare formulare rendere operativi i metodi per soddisfare le nuove necessità sanitarie Pianificare - organizzare - erogare - valutare i servizi (prevenzione, cura educazione sanitaria) Partecipare alla ricerca

Come raggiungere questi obiettivi Studiare le malattie e le loro cause Osservare l’evoluzione delle malattie e dei bisogni dei pazienti Interpretare i fenomeni e modificare modalità operative ed organizzative Acquisire spirito critico per valutare i risultati Assumere decisioni per ottimizzare le prestazioni erogate È importante l’approccio quantitativo ai problemi sanitari

La Statistica Insegna ad utilizzare il metodo scientifico per raccogliere,organizzare l’informazione favorendo la comprensione dei fenomeni naturali Fornisce una serie di metodi per dare un valore oggettivo e generale alle esperienze attraverso la quantificazione dei fenomeni

Le informazioni statistiche Base necessaria per la programmazione di interventi diretti a risolvere problemi della popolazione di un Paese Per interventi in campo sanitario possiamo distinguere due categorie essenziali: Statistiche demografiche Statistiche sanitarie

Statistiche demografiche Struttura della popolazione Nascite Morti Migrazioni Previsioni demografiche

Statistiche sanitarie

Stato di salute Salute percepita Qualità della vita Stili di vita Morbosità Disabilità Mortalità

Servizi sanitari Attività degli istituti di cura Day hospital Accertamenti diagnostici Visite mediche generali e specialistiche Uso di farmaci e medicina alternativa Atteggiamento verso i servizi sanitari

Assistenza Le persone negli istituti L’assistenza sociale Le pensioni ed i pensionati

Spesa sanitaria Conti sanitari nazionali e regionali Modelli di previsione della spesa sanitaria

Valutazione della domanda sanitaria Misura dei bisogni della popolazione Effettivi Potenziali Raccolta di informazioni Fonti amministrative Fonti statistiche

Fonti amministrative Tutta la popolazione di riferimento è osservata Vantaggi:la consultazione dei registri è economica (non sempre legalmente possibile) Svantaggi: minore qualità dei dati, minore possibilità di approfondimento, spesso i registri amministrativi non rispondono pienamente alle finalità dell’analisi

L’inchiesta sanitaria

Registri amministrativi Registri demografici: popolazione residente, nascite, morti, migrazioni,ecc. Registri sanitari: cause di morte, dimissioni ospedaliere, malattie infettive, interruzioni volontarie di gravidanza, attività degli istituti di cura

Indagini statistiche Un’indagine statistica può essere assimilata alla costruzione di un prodotto Materia prima: informazione disponibile presso la popolazione Flusso produttivo: fasi dell’indagine Prodotto finale: informazione statistica

Le fasi di una indagine statistica Progettazione Rilevazione Verifica dei dati e acquisizione su PC Controllo e correzione dei dati Elaborazione dei dati Diffusione dei risultati

Tipologia di indagini Il problema dei costi Indagini totali (considerano tutte le unità osservabili): censimento cause di morte Indagini parziali (considerano solo una parte delle unità osservabili): ragionate campionarie Il problema dei costi

Gli errori di una indagine statistica Il dato statistico è affetto da errore: Errore campionario Errore non campionario: * errori di lista delle unità da osservare * errori nel questionario * errori dovuti alla tecnica di indagine * errori dei rilevatori * errori dovuti ai rispondenti * mancate risposte (totali e parziali)

La tecnica di indagine La tecnica di indagine è il modo in cui si raccolgono le informazioni presso le unità statistiche: Questionario autocompilato: indagine postale indagine via web Utilizzo del rilevatore: indagine face-to-face indagine telefonica

Il questionario I contenuti informativi La struttura del questionario: le domande filtro La struttura delle domande: aperte chiuse La formulazione delle domande Le domande retrospettive Il periodo di riferimento

La raccolta dei dati Formazione delle liste Selezione e reclutamento dei rilevatori Istruzioni ai rilevatori Contatto con le unità da intervistare Raccolta dei dati Attribuzione di codici identificativi alle unità rispondenti

La revisione/acquisizione dei dati Rispondenza campione teorico –campione rispondente Qualità del materiale rilevato Acquisizione su PC

La qualità dei dati prodotti Per garantire la qualità dei risultati è opportuno prevedere un sistema di controlli che ha per oggetto l’errore non campionario e per obiettivi: La prevenzione dell’errore Il monitoraggio della fasi del processo produttivo La correzione dell’errore La stima dell’errore totale

Il sistema dei controlli di qualità Elementi fondamentali del sistema di controlli : individuazione delle cause dell’errore definizione dei livelli di controllo organizzazione dell’informazione metodi di analisi e correzione

La correzione degli errori Errori che è possibile individuare e correggere : mancate risposte totali mancate risposte parziali incoerenze di una singola risposta incoerenze di risposte collegate tra loro

L’elaborazione dei risultati Calcolo di valori assoluti totale delle persone che fanno uso di farmaci Calcolo di percentuali % delle persone con malattie cardiache Calcolo di valori medi numero medio di visite mediche effettuate Le elaborazioni sono effettuate per il totale della popolazione oggetto di indagine e per sottogruppi distinti (sesso, classi di età, ecc.)

Diffusione dei risultati Presentazione di tabelle Presentazione di grafici Commento dei risultati Note tecniche sul processo di produzione del dato

L’Indagine Istat sulle condizioni di salute e sul ricorso ai servizi sanitari Indagine campionaria su circa 40.000 famiglie, condotta ogni 5 anni, sui seguenti argomenti: Condizioni di salute Malattie croniche Peso, statura, dieta Invalidità e riduzione di autonomia Visite mediche Accertamenti diagnostici Servizi ospedalieri Day hospital Pronto soccorso Servizi sanitari Riabilitazione Assistenza domiciliare Prevenzione Apparecchi sanitari Consumo di farmaci Medicina alternativa Consumo di tabacco Gravidanza, parto, allattamento

L’Indagine Istat sugli aspetti della vita quotidiana Si tratta di una indagine campionaria su circa 20.000 famiglie, condotta ogni anno, che riprende alcuni argomenti presenti nell’indagine sulla salute: Salute, malattie croniche, invalidità Medico di base Pronto soccorso Servizi ospedalieri Assistenza domiciliare Farmaci Stili alimentari Consumo di tabacco

Popolazione e unità statistiche L’insieme di tutti gli elementi che si vogliono osservare rispetto a un dato fenomeno si definiscono universo statistico o popolazione I singoli elementi della popolazione si chiamano unità statistiche Possono essere: semplici ( singoli individui, incidenti domestici …) composte ovvero aggregati di unità semplici (famiglie, classi scolastiche)

Le grandi aree della Statistica(1) Statistica Descrittiva Metodo deduttivo (dal generale al particolare) Raccolta dei dati Sintesi dei dati di un campione Presentazione dei risultati (analisi esplorativa)

Le grandi aree della Statistica(2) Statistica inferenziale Metodo induttivo (dal particolare al generale) Rilevazioni parziali (campioni rappresentativi) Stima dei parametri di una popolazione ignota Verifica delle ipotesi

Caratteri e modalità Data una popolazione, si definisce carattere una particolare caratteristica che si presenta in ciascun elemento della popolazione in forme differenti o modalità Studiare una popolazione secondo un dato carattere significa osservare come si distribuiscono in essa le modalità del carattere esaminato Le modalità del carattere in esame devono essere incompatibili ed esaustive: ciascun elemento della popolazione presenta una e una sola delle modalità del carattere in esame

I caratteri statistici Un insieme di unità statistiche può essere descritto secondo uno o più caratteri selezionati in funzione degli obiettivi della ricerca(sesso, età, statura, salute....) L’attribuzione di una modalità (classificazione delle unità statistiche) porta alla formazione del dato statistico Una distribuzione statistica è l’insieme delle modalità che un carattere presenta in un insieme N di unità statistiche

Classificazione dei caratteri Quantitativi (variabili) Caratteri le cui modalità sono misurabili ( a ciascuna corrisponde un numero che esprime una misura) Continuo (possono assumere qualunque valore tra due valori dati) Pressione sanguigna Altezza,( 1,60.. 1,65- 1,66…1,70) peso Discreto (possono assumere solo alcuni valori) Numero bambini, numero attacchi asma alla settimana,... (n figli: possono essere 1, 2,3.. Non 1,4 o 2,5 !!)

Classificazione dei caratteri Qualitativi (mutabili) Caratteri le cui modalità non sono il risultato di misurazioni in senso fisico Ordinale (categorie ordinate) Stadio del cancro al seno; migliore- uguale- peggiore; non sono d’accordo- neutro- sono d’accordo. Sconnesso (categorie non ordinate) Sesso (maschio- femmina); vivo-morto; gruppo sanguigno 0,A,B,AB

Relazioni e operazioni fra le modalità Caratteri Relazioni e operazioni Qualitativi sconnessi Uguaglianza e disuguaglianza Qualitativi ordinati Uguaglianza e disuguaglianza;ordinamento Quantitativi Uguaglianza e disuguaglianza;ordinamento; addizione e sottrazione

CARATTERI E MODALITÀ Le modalità di ogni carattere sono selezionate in base alle unità statistiche in esame, all’oggetto dello studio e alla scelta dell’osservatore Carattere Modalità Sesso - maschio, femmina Colore occhi - marroni, verdi, celesti scuri, chiari Statura -1,55 1,69 1,75 1,80 minore di 1,65, compreso tra 1,65 e 1,80 maggiore di 1,60..

Trasformazione dei caratteri Da quantitativi a qualitativi Statura in cm basso, medio, alto Pressione arteriosa in mm/Hg ipertensione moderata, lieve , grave La trasformazione può essere utile ma comporta una perdita di informazione

(sesso, professione, religione...) Classificazione dei caratteri statistici secondo il livello di misurazione Scale nominali Sono rappresentate da quei caratteri qualitativi le cui modalità non presentano alcun ordine di successione e senza relazione quantitativa tra esse (sesso, professione, religione...) Si possono formulare solo i giudizi: di uguaglianza di disuguaglianza

Classificazione dei caratteri statistici secondo il livello di misurazione Scale ordinali Sono rappresentate da quei caratteri qualitativi le cui modalità presentano un ordine di successione ma non una grandezza: ordinamento di un gruppo di individui secondo un dato carattere Ordine crescente di: reddito, titolo di studio, stadio di una malattia...

Classificazione dei caratteri statistici secondo il livello di misurazione Scale ad intervalli Sono rappresentate da caratteri quantitativi disposti in una scala ordinale in cui è possibile misurare la distanza tra di essi espressi in valori singoli o in classi di valori (lunghezza, statura, peso,....)

Le classificazioni di caratteri e scale Terminologia italiana Terminologia anglosassone Carattere qualitativo sconnesso Scala nominale Carattere qualitativo ordinato Scala ordinale Carattere quantitativo Scala di intervalli

Esempio studente N esami voto valutazione Condizione lavorativa 1 2 24 buono lavoratore 18 sufficiente 3 30 ottimo non 4 28 5 20 6 Un gruppo di studenti è stato classificato secondo alcune informazioni NE = quantitativo discreto V = quantitativo Val = qualitativo ordinato CL = qualitativo sconnesso

Raccolta e organizzazione dei dati

Le fasi delle ricerca Corso di Statistica Definizione del problema Formulazione del disegno di ricerca Raccolta dei dati Valutazione della qualità del dato Elaborazioni statistiche Interpretazione dei risultati

Definizione del problema Corso di Statistica Definizione del problema Si stabiliscono gli obiettivi della ricerca Si definisce il fenomeno Si sceglie la popolazione in cui il fenomeno si manifesta Si individuano le caratteristiche della popolazione che interessano lo studio.

Il disegno della ricerca Corso di Statistica Il disegno della ricerca Definizione delle risorse Il tipo di indagine da effettuare La definizione delle ipotesi La consultazione bibliografica I metodi di rilevazione Gli strumenti da utilizzare L’addestramento degli addetti alla rilevazione Il pre-test (indagine pilota)

Sull’intera popolazione Statistica descrittiva Statistica inferenziale INDAGINE STATISTICA Indagine statistica Raccoglie e analizza i dati Su un campione della popolazione statistica (indagine campionaria) Sull’intera popolazione (censimento famiglie italiane) Statistica descrittiva Trarre indicazioni sull’intera popolazione (descrivere il fenomeno) Statistica inferenziale Trarre indicazioni dal campione che siano valide per l’intera popolazione

I dati e le statistiche I dati possono essere: Primari: se raccolti direttamente dal ricercatore È sufficiente utilizzare semplici schede di registrazione sulle quali riportare i dati di interesse o in caso di banca dati acquisire il file dati del fenomeno che interessa Secondari se ricavabili da una rilevazione già effettuata (Fonti statistiche esistenti es. dati ufficiali, rilevazioni periodiche ..)

Rilevazione di dati Nel caso di dati provenienti da indagine programmata è necessario predisporre un questionario Diretto Compilato dall’intervistato Indiretto Compilato dal ricercatore o dall’intervistatore

IL QUESTIONARIO regole per la stesura I Le finalità del questionario devono essere precise e limitate per garantire logicità e razionalità alla struttura del questionario Il tempo di somministrazione dovrebbe essere sufficientemente limitato

IL QUESTIONARIO regole per la stesura II Le domande devono essere: Univocamente comprensibili e non orientate Relative ad un solo aspetto Possibilmente precodificate Poste in sequenza (dai quesiti semplici a quelli più complessi) In numero limitato (essenziali)

QUALITÀ DEL DATO Valutare sempre i criteri adottati nella raccolta e le finalità della rilevazione Esempio: tipo di colloquio operatore statistico Operatore: ho raccolto 300 cartelle sono molte quale indagine posso fare? Statistico: 300 cartelle sono tante.... Ma rispetto a cosa? Qual è l’universo di riferimento? Cosa intendevi studiare? Quale ipotesi di lavoro hai fatto?

CONTROLLO E VERIFICA DEI DATI Gli errori possono essere: Sistematici:quando si presentano nella stesa maniera per ogni dato rilevato (es. strumento di misura non preciso) Accidentali: si verificano irregolarmente e con modalità differenti (es. trascrizione dati) Casuali : derivanti da fattori non conosciuti e e non controllabili Accertare presenza/assenza di errori prima dello spoglio dei dati

Verifica dell’attendibilità dei dati Controllo compatibilità Evidenzia eventuali errori di contraddizione confrontando 2 o più dati riguardanti la stessa unità statistica e /o lo stesso /i aspetto/i legati logicamente tra loro (età vs anno di nascita) Controllo di coerenza o congruità verifica se il dato rilevato rientra nel campo di definizione del fenomeno (età 0 – 100) Controllo di qualità si basa sui concetti di validità (accuratezza) e di precisione(riproducibilità) un dato è tanto più valido quanto meno si discosta dal valore medio reale del fenomeno tanto più è preciso quanto meno si differenzia da altri valori rilevati (concordanza tra rilevazioni ripetute dello stesso fenomeno)

Il concetto di popolazione statistica L’insieme di tutti gli elementi (unità statistiche) che posseggono il carattere esaminato costituisce l’universo o la popolazione statistica Le unità statistiche possono appartenere a più popolazioni ES : maschio adulto ↓ popolazione Ipertesi coniugati ricoverati Paziente ricoverato unità statistica Cartella clinica Insieme di variabili (caratteri)

Organizzazione dei dati I dati rilevati vengono trascritti Talvolta è necessaria la trasformazione in codici (simboli alfanumerici) lo spoglio dei dati consiste nel classificare ciascuna unità statistica in base alla modalità rilevata Es: 25 soggetti in base al gruppo sanguigno Rilevazione : A,B,B,0,0,AB,0,A,A,0,0,B,AB,A,A,0,0,A,AB,B,,B,0,B,AB Prospetto: 0 IIIIIIII A IIIIIII Modalità B IIIIII AB IIII Frequenze osservate

Classificazione di una popolazione per modalità o per frequenze Si cercano quale modalità dei caratteri considerati è presente in ciascuna delle unità statistiche della popolazione e raggruppando (contando) le unità che si presentano con modalità uguali (frequenze)

Frequenza e distribuzioni di frequenza Per frequenza si intende il numero di volte che si è manifestato un fenomeno Una distribuzione di frequenze fa riferimento al complesso di dati rilevati unendo quelli con le stesse caratteristiche Per ogni modalità del carattere osservato (statura, sesso,..) per frequenze assolute (ni) si intende il numero delle unità nelle quali il carattere presenta la stessa modalità i -ma

Tabella di dati grezzi qualitativi soggetto fumatore 1 si 11 21 2 no 12 22 3 13 23 4 14 24 5 15 25 6 16 26 7 17 27 8 18 28 9 19 29 10 20 30

Spoglio dei dati rispetto alla variabile fumo Modalità Spoglio dei dati Frequenze Fumatori IIII IIII IIII III 18 Non fumatori IIII IIII II II 12 Totale IIIIIIIIIIIIIIIIIIIIII IIIIIIIIIIIIIIIIII 30

Distribuzioni di frequenze Se la distribuzione di frequenze è fatta per un solo carattere, la distribuzione è definita semplice Se i caratteri rispetto ai quali è fatta la distribuzione sono due, tre …. m, la distribuzione di frequenza sarà doppia, tripla ,….multipla

Licenza media inferiore La matrice dei dati I dati codificati in una in una rilevazione statistica su n unità statistiche studiando x variabili sono raccolti in forma di tabella (matrice di dati) N sesso Età (anni) Peso (Kg) Titolo di studio n.° ricoveri 1 M 42 83 laurea 2 F 48 65 diploma ... ....... ...... n 61 79 Licenza media inferiore 4

Ogni riga corrisponde ad una unità statistica La matrice dei dati Ogni riga corrisponde ad una unità statistica N sesso Età (anni) Peso (Kg) Titolo di studio n.° ricoveri 1 M 42 83 laurea 2 F 48 65 diploma ... ....... ...... n 61 79 Licenza media inferiore 4

Ogni colonna rappresenta una variabile La matrice dei dati Ogni colonna rappresenta una variabile N sesso Età (anni) Peso (Kg) Titolo di studio n.° ricoveri 1 M 42 83 laurea 2 F 48 65 diploma ... ....... ...... n 61 79 Licenza media inferiore 4

Analisi ed elaborazione statistica dei dati Sintesi dei dati Tabelle frequenze (distribuzioni di frequenze) Indici statistici Per sintetizzare un carattere Per confrontare diverse situazioni

50 unità classificate secondo la statura 148 159 150 152 157 150 155 158 153 154 160 162 166 161 169 161 165 165 168 162 166 160 164 161 168 163 179 173 170 178 171 177 175 171 172 175 177 178- 180 188 189 182 186 181 188 180-190 199

Distribuzione in classi In presenza di un carattere con molte modalità è possibile (è conveniente!) formare delle classi di valori Ne deriverà una variabile statistica divisa per intervalli o classi di frequenza In ciascuna delle classi si raccolgono tutte le osservazioni che cadono al suo interno I dati così organizzati costituiscono una distribuzione di frequenze definita distribuzione in classi

Distribuzione in classi I valori minimo massimo della classe si definiscono limiti di classe: limiti inferiori e limiti superiori Statura in cm frequenze assolute (classi) ni 140 – 149 2 150 – 159 9 160 – 169 17 170 – 179 12 180 – 189 8 190 - 199 2 Ciascuna coppia di limiti costituisce l’intervallo della classe

Distribuzione in classi Statura in cm frequenze assolute (classi) ni 140 – 149 144,5 2 150 – 159 154,5 9 160 – 169 ..... 17 170 – 179 ..... 12 180 – 189 8 190 - 199 2 Il valore centrale di una classe è dato dalla semisomma degli estremi limite inferiore + limite superiore 2

Criteri per costruire una distribuzione in classi Identificare il campo di variazione (differenza tra il valore più grande e il più piccolo) Suddividere il campo di variazione in un numero conveniente di classi secondo la numerosità dei dati Una tabella con un numero elevato di classi è troppo simile alla tabella di origine dei dati; una con poche classi, eccessivamente ampie, fa perdere troppe informazioni Gli intervalli di classe dovrebbero avere la stessa ampiezza L’obiettivo della divisione in classi è una migliore leggibilità della tabella senza perdere troppe informazioni !

Distribuzione di frequenza di 50 unità classificate secondo la statura Statura in cm. Unità statistiche frequenze assolute (in classi) ni 140-149 II 2 150-159 IIIIIIIII 9 160-169 IIIIIIIIIIIIIIIII 17 170-179 IIIIIIIIIIII 12 180-189 IIIIIIII 8 190-199 II 2

Frequenza, distribuzioni di frequenza II La somma delle frequenze assolute è = al totale N delle unità del collettivo Oltre le frequenze assolute si considerano le frequenze relative indicano il rapporto tra la frequenza assoluta della modalità i –ma e il numero totale N La somma di tutte le frequenze relative di tutte le modalità in cui si articola il carattere considerato è =1 (o a 100 se le frequenze relative sono espresse in percentuali)

Distribuzione di frequenza di 50 unità classificate secondo la statura Statura in cm. frequenze assolute frequenze Frequenze % (in classi) assolute relative ni 140-149 2 0.04 4 150-159 9 0.18 18 160-169 17 0.34 34 170-179 12 0.24 24 180-189 8 0.16 16 190-199 2 0.04 4

Distribuzione di frequenza variabile qualitativa Colore degli occhi Frequenza Assoluta Relativa Percentuale ni fi % Modalità Castani 500 0.714 71.4 Azzurri 100 0.143 14.3 Verdi 100 0.143 14.3 Totale(Σi) 700 1 100 Frequenze relative = frequenze assolute totale Frequenze percentuali = frequenze relative x 100

Uso di frequenze percentuali(1) In presenza di osservazioni di più caratteri contemporaneamente si possono calcolare più frequenze relative e percentuali Si possono dare interpretazioni errate se non si definisce accuratamente il denominatore Es: la frequenza % delle donne che fumano può essere calcolata in riferimento al totale delle donne, in relazione al totale dei fumatori, al totale dei soggetti esaminati La frequenza assoluta delle donne fumatrici (numeratore) è sempre la stessa. Il denominatore cambia in base ad ogni possibile relazione

Uso di frequenze percentuali(2) Attenzione al significato che si attribuisce alle percentuali in presenza di una bassa numerosità delle frequenze! Piccole variazioni, probabilmente casuali, vengono sottolineate alterando il risultato ES. Se mensilmente i ricoverati per una patologia passano da 4 a 5 e successivamente a 3, appare ingiustificato evidenziare variazioni percentuali sensibili rispettivamente di +25% e -40% Pur se esatto il calcolo matematico, statisticamente si attribuisce un eccesso di significato a banali fluttuazioni in un fenomeno che appare costante nel tempo

Variabile sesso Frequenze assolute (n) Frequenze relative (f) matricole di matricole di Statistica Medicina M 16 33 F 17 92 Frequenze relative (f) matricole di matricole di Statistica Medicina M (16/33)=48.5% (33/125)=26,4% F (17/33)=51.5% (92/125)=83,6%

Variazioni percentuali Età Peso prima Peso dopo Variazione % Paziente1 26 58 60 3,4 Paziente 2 52 63 56 -11,1 Paziente 3 61 84 73 -13,1 Paziente 4 43 70 75 7,1 P f – P i / Pi x 100 60 – 58 / 58 x 100 = 3,4

Frequenze cumulate La frequenza cumulata (assoluta, relativa e percentuale) in corrispondenza di un valore Xi indica il numero di volte che la variabile X ha assunto valori pari o inferiori a Xi Frequenze assolute cumulate C1 = N1 C2 = N1+N2 C3 =N1+N2+N3 ..... Ck = N1+N2+N3... + Nk

Distribuzione in classi:caratteristiche e quadro delle frequenze classe Peso (Kg) x c f f % fcum f%cum I 40├ 45 42.5 6 5.6 II 45├ 50 47.5 15 14.0 21 19.6 III 50├ 55 52.5 28 26.2 49 45.8 IV 55├ 60 57.5 35 32.7 84 78.5 V 60├ 65 62.5 14 13.1 98 91.6 VI 65├ 70 67.5 5 4.7 103 96.3 VII 70├ 75 72.5 4 3.7 107 100.0 Valori centrali xc (40+45)/2=42.5; (45+50)/2=47.5;.....; (70+75)/2=72.5 Ampiezza di classe c partendo dai confini: 45-40=5; 50-45=5;..... ; 75-70=5;

Più variabili rilevate per unità statistica Distribuzione di frequenza di 50 unità classificate secondo il sesso Sesso unità statistiche frequenze assolute ni Maschi IIIIIIIIII IIIIIIIIII III 23 Femmine IIIIIIIIII IIIIIIIIII IIIIIIII 27

Più variabili rilevate per unità statistica Distribuzione di frequenza di 50 unità classificati per sesso e statura Statura in cm. Sesso 140-149 150-159 160-169 170-179 180-189 190-199 Totale Maschi 2 4 7 7 2 1 23 Femmine 0 5 10 8 3 1 27 Totale 2 9 17 15 5 2 50

Schema per tabella a due entrate Y X CARATTERE Y Totale riga y1 y2 y3….. yj….. ym C A R T E x 1 f11 f12 f13… f1j… f1m F1 x2 f21 f22 f23… f2j…. f2m F2 x3 …… f31 f32 f33… f3j… f3m F3 xi …. fj1 ….. fj2 fj3…. fij … fim Fi xn fn1 fn2 fn3… fnj... fnm Fn colonna F3...... F.j...... F.m F..