Come descrivere un fenomeno in ambito sanitario: fondamenti di statistica descrittiva Brugnaro Luca.

Slides:



Advertisements
Presentazioni simili
- le Medie la Moda la Mediana
Advertisements

Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
SCALA INTERVALLO / A RAPPORTO
____________________
LA VARIABILITA’ IV lezione di Statistica Medica.
Indici di dispersione Quantili: sono misure di posizione non centrale che dividono la serie ordinata di dati in un certo numero di parti di uguale numerosità.
STATISTICA DESCRITTIVA
Variabili casuali a più dimensioni
Sintesi dei dati La sintesi dei dati comporta una perdita di informazioni, deve quindi essere privilegiato l’indice di sintesi che minimizza la perdita.
Lez. 3 - Gli Indici di VARIABILITA’
Descrizione dei dati Metodi di descrizione dei dati
Progetto Pilota 2 Lettura e interpretazione dei risultati
Elementi di STATISTICA DESCRITTIVA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia l’analisi statistica.
Esercizio 1 In una indagine statistica si vuole rilevare il numero di cellulari posseduti dagli studenti iscritti alla facoltà di economia. Si dica: -
Inferenza statistica per un singolo campione
STATISTICA DESCRITTIVA
Introduzione alla statistica per la ricerca Lezione I
COSA VUOL DIRE FARE STATISTICA
Processi Aleatori : Introduzione – Parte I
Come descrivere un fenomeno in ambito sanitario: fondamenti di statistica descrittiva Brugnaro Luca.
Complementi al Corso di Ecologia - Approfondimenti di statistica
Misurazione Le osservazioni si esprimono in forma di misurazioni
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
Nicola Paparella, Università degli Studi, Lecce, aprile 2006 Pedagogia sperimentale Note ed appunti Corso di base / 5
METODI E CONTROLLI STATISTICI DI PROCESSO
Statistica descrittiva
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Simone Mosca & Daniele Zucchini 4Bi.
INDICE I VALORI MEDI LA MEDIA GEOMETRICA LA MEDIA ARITMETICA
STATISTICA La statistica è la scienza che ha come fine lo studio quantitativo e qualitativo di un "collettivo". Studia i modi (descritti attraverso formule.
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.
Lez. 3 - Gli Indici di VARIABILITA’
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Statistica La statistica è
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
La statistica.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
COSA VUOL DIRE FARE STATISTICA
Accenni di analisi monovariata e bivariata
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
Martina Serafini Martina Prandi
IL CAMPIONE.
ORIENTAMENTO CONSAPEVOLE
Marta Pinto Stefania Serra Valentina Paravidino
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
Elaborazione statistica di dati
Accenni di analisi monovariata e bivariata
ANALISI E INTERPRETAZIONE DATI
STATISTICHE DESCRITTIVE
TRATTAMENTO STATISTICO DEI DATI ANALITICI
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
1 Statistica descrittiva 2. Sintetizzare i dati con degli indici Come descrivere una variabile in un insieme di osservazioni 1. Utilizzare rappresentazioni.
RAPPRESENTAZIONE DATI LA RAPPRESENTAZIONE PUÒ ESSERE UTILIZZATA A SCOPO DI ANALISI, INTERPRETAZIONI E COMUNICAZIONI. PER RAGGIUNGERE QUESTI OBIETTIVI È.
Statistica : scienza che ha come fine lo studio quantitativo e qualitativo di un “collettivo”. L’etimologia della parola pare derivi dal vocabolo “stato”e.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
Analisi delle osservazioni
DEFINIZIONE. La statistica è la disciplina che si occupa della raccolta di dati quantitativi relativi a diversi fenomeni, della loro elaborazione e del.
Gli Indici di VARIABILITA’
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

Come descrivere un fenomeno in ambito sanitario: fondamenti di statistica descrittiva Brugnaro Luca

Alice nel paese delle meraviglie Alice: Volevo soltanto chiederle che strada devo prendere! Stregatto: Beh, tutto dipende da dove vuoi andare! Brugnaro Luca (2012)

La vostra amica presenta i risultati in questo modo: Una vostra amica, laureanda in Medicina e Chirurgia, vi fa leggere la sua tesi di laurea per verificare le analisi dei dati da lei condotte. Nella tesi, tra le altre cose, viene raccontato che 35 persone sane hanno seguito per 4 settimane una certa dieta. A queste persone è stato dosato il colesterolo prima dell’inizio e alla fine della dieta. La vostra amica presenta i risultati in questo modo: “Dato che la media delle 35 misurazioni di colesterolo effettuate prima dell’inizio della dieta è risultata uguale a 230,4 mg/dl mentre la media dopo quattro settimane di dieta è risultata uguale a 203,6 mg/dl possiamo concludere che la dieta considerata è efficace (almeno in media) per ridurre il colesterolo” Brugnaro Luca (2012)

Progetto formativo complessivo Obiettivo: incrementare le competenze degli operatori sanitari nelle metodiche per l’analisi ed interpretazione dei fenomeni collettivi e della letteratura consapevole degli articoli scientifici Brugnaro Luca (2012)

Strategia formativa Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva Corsi di base (propedeutici) Epidemiologia: principali misure epidemiologiche e disegni di studio Metodi statistici (inferenza) Interpretazione dei fenomeni in ambito sanitario: dal campione alla popolazione Analisi dei dati clinici: tabelle, grafici, test di verifica d’ipotesi e cenni sui modelli statistici Brugnaro Luca (2012)

Statistica e ambito sanitario Gap di conoscenza Evidence Based Medicine/Nursing Bibliografia scientifica (es. NLM) Ricerca clinica Gap di conoscenza Brugnaro Luca (2012)

Il problema Quando leggiamo la bibliografia scientifica sappiamo riconoscere la presenza di eventuali “bufale” ? Brugnaro Luca (2012)

“è il momento empirico di tutte le scienze” Statistica La statistica è una disciplina che ha come fine lo studio quantitativo e qualitativo di un particolare fenomeno (collettivo). Studia i modi in cui un fenomeno può essere sintetizzato, rappresentato e quindi compreso. “è il momento empirico di tutte le scienze” Brugnaro Luca (2012)

Chiariamo alcuni termini Popolazione: qualsiasi insieme di elementi, reale o virtuale, che forma oggetto di studio E’ di fondamentale importanza (nonché indicatore di serietà della ricerca) definire esattamente la popolazione di riferimento della nostra indagine Unità statistica: elemento di base della popolazione sul quale viene effettuata la rilevazione o la misurazione di uno o più fenomeni oggetto di studio. E’ indivisibile nell’ambito della ricerca ma non in senso assoluto (es.: famiglie) Campione: un sottoinsieme della popolazione che si seleziona per l’analisi. Di particolare importanza sono i campioni determinati con processi casuali. Brugnaro Luca (2012)

Popolazione Si distingue anche tra: popolazione finita: un insieme le cui unità possono essere tutte concretamente osservate (ad esempio, l'insieme delle persone, delle abitazioni o delle aziende oggetto di un censimento); popolazione infinita: un insieme definibile con accuratezza ma non concretamente osservabile (ad esempio tutti i pazienti affetti da patologia “y”, tutte le compresse prodotte da uno stabilimento, …). Altri concetti legati a popolazione: popolazione o universo Popolazione obiettivo, Popolazione raggiungibile,... Brugnaro Luca (2012)

Popolazione e unità statistiche L’oggetto dell’osservazione di ogni fenomeno individuale che costituisce il fenomeno collettivo è detto unità statistica Esempi di unità statistiche: ogni individuo di una popolazione, ciascuna coppia di sposi, ogni campione biologico che finisce nel laboratorio di analisi Brugnaro Luca (2012)

Il campione e il campionamento Il campione è un qualsiasi insieme di unità statistiche selezionato dalla popolazione in oggetto di analisi Il campionamento rappresenta la metodica utilizzata per la scelta del campione all’interno di una popolazione Il campionamento è la tecnica statistica di estrazione di un numero limitato e definito di elementi che fanno parte di un insieme chiamato universo Il campione dovrebbe fornire un’immagine ridotta, ma fedele della popolazione (universo) Perché usare un campione e non tutta la popolazione?  Brugnaro Luca (2012)

Il campione e il campionamento Le indagini sull'intera popolazione (censimenti) pur essendo più affidabili riguardo al parametro oggetto d'indagine sono anche: più costose più lunghe da realizzarsi meno accurate non sempre oggettivamente realizzabili Applicazioni in campo aziendale delle tecniche statistiche sono rappresentati dai “controlli statistici della qualità” (statistical quality control) utili per controllare i processi, allo scopo di garantire che la qualità del prodotto finito sia conforme e all’altezza di determinati standard prestabiliti. Brugnaro Luca (2012)

Statistica inferenziale Una analisi statistica si dice inferenziale quando è utile per desumere da un campione un'informazione relativa a tutta la popolazione Alla base della statistica inferenziale vi sono due grossi argomenti (tra loro fortemente legati): la teoria della stima la verifica d’ipotesi Brugnaro Luca (2012)

Statistica descrittiva Un’analisi statistica si dice descrittiva se studia i criteri di rilevazione, di classificazione e di sintesi delle informazioni relative ad una popolazione oggetto di studio. La statistica descrittiva ha come obiettivo quello di organizzare, riassumere e presentare i dati e i suoi strumenti permettono quindi di sintetizzare i dati attraverso: valori di centralità, indici di variabilità, indici di forma, rapporti statistici, relazioni statistiche. Brugnaro Luca (2012)

Cosa osservare Della popolazione si osservano una o più “variabili” (es: età, la durata della degenza, la diagnosi d’ingresso, area di una lesione da pressione, lunghezza di una sutura, il sesso, la temperatura, …). Le tecniche statistiche di analisi e descrizione dei fenomeni collettivi si differenziano in funzione del tipo di “variabile” che si osserva! Brugnaro Luca (2012)

Variabili/Mutabili Un carattere osservato in una popolazione o campione prende il nome di: variabile quando assume come modalità dei numeri (reali) mutabile quando invece le modalità rappresentano delle qualità Nel linguaggio moderno, spesso il termine variabile viene usato in maniera indistinta sia per le variabili in senso stretto sia per le mutabili. Sovente si specifica il tipo di variabile facendo seguire l’aggettivo quantitativa o quantitativa per indicare la corretta natura del carattere considerato. Brugnaro Luca (2012)

Tipi di variabili Quantitative Qualitative Scala intervallo Scala rapporto Qualitative Categoriali Ordinali Il tipo di variabile determina le tipologie di analisi statistiche che si potranno eseguire Brugnaro Luca (2012)

Frequenze assolute Distribuzioni di frequenza Si tratta del più semplice strumento di sintesi e analisi dei dati Una frequenza (assoluta) è il numero di volte che si manifesta una specifica modalità di una variabile osservata/registrata Una tabella di frequenza o distribuzione di frequenza registra per ogni categoria, valore, o classe di valori che una variabile potrebbe avere e il corrispondente numero di volte che ognuna di esse ricorre nei dati Brugnaro Luca (2012)

Frequenze relative Consiste nel rapporto tra il numero di volte in cui una modalità osservata e il numero totale delle osservazioni eseguite. Rappresentata la percentuale di tale classe rispetto al totale delle osservazioni. Sono utili per poter confrontare le frequenze in caso di numerosità diverse. Brugnaro Luca (2012)

Frequenze cumulate Le frequenze cumulate sono la somma fino ad i-esimo raggruppamento delle frequenze assolute. Hanno senso solo per i dati che possiedono un ordinamento È possibile calcolare le frequenze cumulate relative (Fi) che vengono dette anche Funzione di ripartizione empirica Le frequenze cumulate sono non decrescenti e da esse si possono ricavare per differenza le frequenze semplici Brugnaro Luca (2012)

Indici di posizione Permettono di poter esprimere un'idea dell'ordine di grandezza (la posizione sulla scala dei numeri, appunto) dei valori esistenti. Sono indici di posizione: Media , comprese la media aritmetica, media geometrica e media armonica Mediana, quartile, quantile (o percentile) Moda Un modo per rappresentare graficamente alcuni indici di posizione è il box-plot Brugnaro Luca (2012)

Media aritmetica Viene calcolata sommando i diversi valori a disposizione, i quali vengono divisi per il loro numero complessivo È il tipo di media impiegato più comunemente e quello al quale, con il termine "media", si fa in genere riferimento nel parlare comune Viene usata per riassumere un insieme di dati su un fenomeno misurabile (per esempio, l'altezza media di una popolazione) Oltre che in matematica, la media aritmetica è ampiamente impiegata in svariati campi, quali economia, sociologia e nella maggior parte delle discipline accademiche. Nonostante la media aritmetica sia spesso usata risente notevolmente dei valori ”lontani”dalla distribuzione (outlier). Nelle distribuzioni simmetriche la media aritmetica può non accordarsi con altri indici più robusti, come la mediana. Brugnaro Luca (2012)

Mediana, quartile, quantile Sono tutte delle statistiche ordinate Si definisce mediana, o mediano, come il valore (o l'insieme di valori) assunto dalle unità statistiche che si trovano nel mezzo della distribuzione Per calcolare la mediana di n dati: si ordinano gli n di dati in ordine crescente o decrescente; se il numero di dati è dispari la mediana corrisponde al valore centrale, ovvero al valore che occupa la posizione (n + 1) / 2. se il numero n di dati è pari, la mediana è stimata utilizzando i due valori che occupano le posizione (n / 2) e ((n / 2) + 1) In statistica, i quartili sono valori che ripartiscono una popolazione in 4 parti ugualmente popolate I percentili sono particolari quantili che dividono la popolazione in 100 parti uguali Brugnaro Luca (2012)

Indici di variabilità Range o campo di variazione Scarto interquartile Varianza Deviazione standard Coefficiente di variazione Brugnaro Luca (2012)

Range o campo di variazione Rappresenta la differenza tra il valore massimo e quello minimo della distribuzione dei dati del fenomeno osservato/rilevato Brugnaro Luca (2012)

Scarto interquartile Ordinando la distribuzione dei dati dal più piccolo al più grande e dividendo in numero delle unità statistiche osservate in quattro gruppi di uguale numerosità individuiamo i quartili È la differenza tra il terzo e il primo quartile ovvero l'ampiezza della fascia di valori che contiene la metà "centrale" dei valori osservati Brugnaro Luca (2012)

Varianza Fornisce una misura di quanto siano disperse le modalità dalla variabile rilevata, ovvero di quanto si discostino dalla media E[X] È sempre maggiore o uguale a 0 È zero se tutti i valori della distribuzione sono uguali Var[X] = ∑(Xi – E[X])2 / n Brugnaro Luca (2012)

Deviazione standard Fornisce una misura di quanto siano dispersi i valori assunti dalla variabile esaminata, ovvero di quanto si discostino dalla media E[X] È una misura di variabilità di una popolazione di dati derivato direttamente dalla varianza, ha la stessa unità di misura dei valori osservati (mentre la varianza ha come unità di misura il quadrato dell'unità di misura dei valori di riferimento) La deviazione standard misura la dispersione dei dati intorno al valore atteso. In statistica la precisione si può esprimere come deviazione standard (σ) Sinonimi di deviazione standard sono scarto quadratico medio e scarto tipo Brugnaro Luca (2012)

Coefficiente di variazione A partire dalla deviazione standard si definisce anche il coefficiente di variazione o la deviazione standard relativa (RSD) come il rapporto tra lo scarto quadratico medio σ e la media aritmetica dei valori RSD = σ / E[X] Questo nuovo parametro consente di effettuare confronti tra dispersioni di dati di tipo diverso, indipendentemente dalle loro unità di misura Brugnaro Luca (2012)

Tabelle di contingenza Sono un particolare tipo di tabelle a doppia entrata (cioè tabelle con etichette di riga e di colonna), utilizzate in statistica per rappresentare e analizzare le relazioni tra due o più variabili. In esse si riportano le frequenze congiunte delle variabili Le due variabili considerate sono di tipo quantitativo discreto o qualitativo Sommando tutte le frequenze assolute presenti nella tabella, troveremo la numerosità n della popolazione Le combinazioni tra le modalità della variabile in riga e di quelle della variabile in colonna della tabella rappresentano le frequenze congiunte La somma delle frequenze relative di una riga o di una colonna si definiscono come distribuzioni marginali Brugnaro Luca (2012)