STATISTICA DESCRITTIVA

Slides:



Advertisements
Presentazioni simili
I dati Qualsiasi contenuto dell’esperienza.
Advertisements

Testi di epidemiologia di base
8) GLI INTERVALLI DI CONFIDENZA
MISURAZIONE Operazione che permette di associare coerentemente numeri alle caratteristiche di un insieme di oggetti o individui 4 i 5  2 R 3 1 6 3.
Il linguaggio della statistica
“Studio della frequenza, di una malattia nella popolazione
METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI
STATISTICA DESCRITTIVA
Intervalli di confidenza
Agenda Statistica Andamento e struttura della popolazione di Bolzano e dei suoi quartieri e dei suoi quartieri maggio 2008 Ufficio Statistica e.
1 la competenza alfabetica della popolazione italiana CEDE distribuzione percentuale per livelli.
“Teoria e metodi della ricerca sociale e organizzativa”
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Lez. 3 - Gli Indici di VARIABILITA’
Gli errori nell’analisi statistica
Progetto Pilota 2 Lettura e interpretazione dei risultati
Elementi di STATISTICA DESCRITTIVA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia l’analisi statistica.
Popolazione, campione, parametri e stimatori
Inferenza statistica per un singolo campione
Rappresentazioni grafiche di serie di frequenza … etc … etc
LIBRO – BIOSTATISTICA [Pagano-Gauvreau]
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
Inferenza su proporzioni
Innanzitutto divertiamoci
DALL'INTERVALLO DI PROBABILITÀ
Obiettivi del corso di Statistica Medica.
1 Introduzione alla statistica per la ricerca Lezione III Dr. Stefano Guidi Siena, 18 Ottobre 2012.
Introduzione alla statistica per la ricerca Lezione I
Processi Aleatori : Introduzione – Parte I
Appunti di inferenza per farmacisti
Esempio di regressione ordinale
Metodi di ricerca in Psicologia
Corso di biomatematica Lezione 2: Probabilità e distribuzioni di probabilità Davide Grandi.
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
STATISTICA a.a LA STATISTICA INFERENZIALE
STATISTICA a.a VARIABILITA’ BIOLOGICA E CASO
Epidemiologia Studio quantitativo della distribuzione*, dei determinanti e del controllo delle malattie nelle popolazioni * spazio, tempo, persone.
MISURE EPIDEMIOLOGICHE
Complementi al Corso di Ecologia - Approfondimenti di statistica
Misurazione Le osservazioni si esprimono in forma di misurazioni
Gli italiani e la questione sullo smaltimento dei rifiuti Istituto per gli Studi sulla Pubblica Opinione Settembre 2002.
EPIDEMIOLOGIA Studio della distribuzione della salute e delle malattie, sia infettive che cronico-degenerative, nella popolazione e dei fattori che ne.
database e distribuzioni
Verifica delle ipotesi su due campioni di osservazioni
METODI E CONTROLLI STATISTICI DI PROCESSO
Statistica descrittiva
C ONCETTI B ASE DI S TATISTICA. C ONCETTI BASE DI S TATISTICA WWW. CENTROSTUDIGORGIA. COM La statistica studia i fenomeni ripetibili del mondo con determinazione.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Introduzione Statistica descrittiva Si occupa dellanalisi dei dati osservati. Si basa su indicatori statistici (di posizione, di variazione, di concentrazione,
DIPARTIMENTO DI MEDICINA MOLECOLARE
Le distribuzioni campionarie
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Indici di posizione Francesco Michele Mortati - Istat.
La statistica.
La vecchiaia di successo: prevenzione lavoro e stili di vita Aspetti economici e sociali Giorgio L. Colombo Università degli Studi di Pavia, Facoltà di.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
Ing. Maurizio Bassani LOGISTICA - Capitolo 3 - Modulo 1
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Corso di Laurea in Scienze e tecniche psicologiche
La covarianza.
Corso di Statistica Applicata C. L. in Tecnologie forestali e ambientali 4 crediti (32 ore) Docente: Lorenzo Marini DAFNAE, Università di Padova
Ipotesi operative TeoriaEsperienza diretta e/o personale Quesito Piano esecutivo Scelta popolazione Scelta strumenti Scelta metodi statistici Discussione.
INDICATORI DI TENDENZA CENTRALE. Consentono di sintetizzare un insieme di misure tramite un unico valore “rappresentativo”  indice che riassume o descrive.
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

STATISTICA DESCRITTIVA INFERENZIALE Ho un insieme di dati e li voglio descrivere, sintetizzare e commentare Ho un insieme di dati e li utilizzo per fare induzione e previsione

LA TERMINOLOGIA Statistica descrittiva ed inferenziale Campione e Universo Parametri e Stime Variabili e Dati Scale di misura Rappresentazione grafica La Statistica ha una sua terminologia. Molti termini sono familiari: alcuni sono usati nel linguaggio ordinario sia pure in accezioni leggermente diverse.

 Il campione è soltanto una parte del tutto. UNIVERSO e CAMPIONE Un campione è un insieme di elementi tratti da un universo (o popolazione). Un universo consiste della totalità degli elementi che hanno certe caratteristiche. Esempi: Universo: tutti i pazienti adulti con una certa malattia. Campione: 120 pazienti con quella malattia, inclusi in una sperimentazione clinica. Universo: un lotto di 5000 compresse. Campione: 10 compresse di quel lotto sottoposte al controllo del peso.   Il campione è soltanto una parte del tutto.

PARAMETRI DELL'UNIVERSO E STIME I parametri sono caratteristiche tipiche e costanti di un dato universo ed hanno, in genere, valore ignoto: sono anche detti costanti o valori veri per distinguerli dai valori campionari che sono invece variabili. I parametri sono indicati con lettere greche (es.: una media si denota con , una proporzione con ). Esempi: La media dei pesi di tutte le compresse in un certo lotto di produzione (). La proporzione di -talassemici tra tutti i nati nella provincia di Ferrara tra il 1950 ed il 1989 ().

INFERENZA Nelle situazioni sperimentali si eseguono osservazioni su di un campione per trarre conclusioni (o fare inferenza) sulle caratteristiche della universo. Tale procedura è necessaria poiché un universo infinito non è conoscibile in modo esaustivo, neppure virtualmente. (es: tutti i soggetti con tubercolosi polmonare nella storia, anche futura, dell'umanità; la totalità delle misure che si possono ottenere con un certo spettrofotometro) Anche un universo finito (es: tutti i residenti a Milano; tutte le fiale di un lotto) di rado può essere esplorato completamente, per problemi di tempo o costo.

VARIABILI E DATI Si dicono variabili le caratteristiche rilevabili di un dato sistema oggetto di studio I dati sono i valori assunti dalle variabili I dati sperimentali si presentano sotto differenti forme, essi possono essere sia di tipo quantitativo sia di tipo qualitativo, ed essere espressi o con scale continue o con scale discrete.

Esempi: sesso, età, peso (di pazienti inclusi in uno studio), I valori numerici ( anni, per la variabile "età"; chili, per il "peso corporeo", mmHg, per la "pressione arteriosa" ) o le modalità ( maschio o femmina per la variabile "sesso"; A, AB, B, 0 per il "gruppo sanguigno", elementare, media inferiore, media superiore, università , per la variabile "titolo di studio ), assunti dalle variabili, costituiscono i dati, ricavabili da esperi-menti scientifici, da indagini epidemiologiche o di mercato.

Le variabili Scala Variabili Discreta Continua Esempio 1 Quantitative Qualitative Esempio 2 Variabili Nominale Ordinale Esempio 3 Esempio 4

VARIABILI QUANTITATIVE IN SCALA DISCRETA Si dicono discrete quelle variabili che possono assumere … un numero finito di valori (es.: il numero di nati mal-formati in un anno, il numero di cavie sopravvissute ad una data dose di farmaco sommi-nistrata a 20 cavie), Oppure un'infinità numerabile di valori, almeno virtualmente (es.: il numero di attacchi anginosi per settimana in un soggetto coronaropatico).

VARIABILI QUALITATIVE IN SCALA NOMINALE Discrete sono inoltre le variabili che esprimono qualità o modalità che non si possono porre in ordine di grandezza, ad esempio il sesso (femmina, maschio) o il gruppo sanguigno (0, A, B, AB). La scala in cui sono espresse tali variabili è detta scala nominale.

SCALA NOMINALE (esempi) AB B Gruppo sanguigno di 100 soggetti residenti nella provincia di Bologna. Distribuzione di frequenza del gruppo sanguigno di 100 soggetti residenti nella provincia di Bologna Tipo n° soggetti 47 A 41 B 9 AB 3 Totale 100 

SCALA NOMINALE (esempi) SCALA DICOTOMICA: dati più semplici consistono in osservazioni non ordinate dicotomiche o del tipo "tutto o nulla"; cioè: il paziente vive o muore, ha o non ha un particolare attributo. Stato a 28 giorni dal ricovero Trattati con propranololo Non trattati Morti 7 17 Vivi 38 29 Totale 45 46 % sopravvivenza 84% 63% 

SCALA NOMINALE (esempi) Non necessariamente una scala nominale deve essere dicotomica; spesso vi sono più di due alternative o criteri di classificazione. Per esempio i gruppi sanguigni illustrano una scala policotomica non ordinata.   Gruppo Sanguigno donne con tromboembolia donne senza tromboembolia n. % n A 32 58 51 35 B 8 15 19 13 AB 6 11 5 3 9 16 70 49 Totale 55 100 145 

nulla < lieve < moderata< forte SCALA ORDINALE Non sempre le variabili continue sono misurabili in modo quantitativo, anche se i loro valori possono esser disposti in ordine di grandezza. Un paziente arruolato in uno studio di efficacia di un analgesico, può patire una qualunque intensità di dolore senza potervi associare una quantità. Egli, però, può classificare l'intensità del dolore nella scala ordinale: nulla < lieve < moderata< forte Alle modalità si associa un punteggio (es.: nulla=0, lieve=1, moderata=2, forte=3) che non ha significato quantitativo: 2 non è il doppio di 1, 3 non è il triplo di 1, la differenza tra 2 e 1 non è uguale a quella tra 3 e 2. 

SCALA ORDINALE Una variabile quantitativa può anche essere misurata su scala ordinale. Esempi: L'età dei pazienti può essere espressa nella scala ordinale bambini < ragazzi < adulti < anziani Il numero di episodi anginosi alla settimana può essere espresso in scala ordinale assenti < rari < frequenti o, addirittura, in modo binario: NO < SI 

SCALA ORDINALE Distribuzione di frequenza della variabile "Titolo di studio" (L'Italia in cifre, ISTAT 1996). Titolo di studio n° soggetti nessuno 1.123 elementare 23.962 media inferiore 16.418 media superiore 9.947 laurea 2.032 Totale 53.482 

SCALA A RANGHI La scala a ranghi è quella che ordina gli elementi di un gruppo dal maggiore al minore in accordo alla grandezza delle osservazioni, assegna i numeri d'ordine corrispondenti alla posizione occupata (rango) e trascura le distanze tra gli elementi ordinati. Per esempio, si supponga che pazienti con cefalea cronica partecipino ad una prova clinica in cui essi ricevono 4 differenti preparati analgesici in 4 differenti occasioni. Al paziente si chiede di classificare i preparati in funzione del livello di riduzione del dolore da un massimo ad un minimo. Se un paziente ritiene che il farmaco A sia migliore e il farmaco B il secondo, egli dovrebbe assegnare ai due rispettivamente il rango 1 e 2 indipendentemente dal fatto che egli ritenga A molto superiore o appena meglio di B. 

 SCALA A RANGHI Punteggio: DA ZERO A DIECI Punteggio attribuito a 5 caratteristiche del neonato rilevate all'esame obiettivo necessarie per ottenere il punteggio Apgar.   Punteggio 1 2 Frequenza cardiaca assente < 100 > 100 Respirazione lenta ed irregolare normale, piange Tono muscolare flaccido flessione estremità buona motilità Riflessi nessuna risposta deboli movimenti reazione vigorosa Colorito pallido estremità cianotiche rosato Caratteristica  Punteggio: DA ZERO A DIECI 

SCALA NUMERICA DISCRETA Distribuzione di frequenza del numero di componenti per famiglia (L'Italia in cifre, ISTAT 1996). Componenti n° famiglie(Frequenze) modalità assolute relative cumulate 1 4.101 0.206 4 101 2 4.917 0.247 9 018 0.453 3 4.419 0.222 13 437 0.675 4 4.220 0.212 17 657 0.887 5 1.572 0.079 19 229 0.966 6 477 0.024 19 706 0.990 7 o più 203 0.010 19 909 1.000 Totale 19.909 

VARIABILI QUANTITATIVE IN SCALA CONTINUA Si dice continua una variabile che può virtualmente assumere un qualsiasi valore reale, in un certo ambito. Ad esempio, Achille può essere alto esattamente metri¸ cioè 1.7724538509... m. In pratica, tuttavia, le misure di una variabile quan-titativa possono assumere solo certi valori, in relazione al potere di risoluzione dello strumento di misura. Ad esempio, l'altezza di Achille è 1.77 m, se misurata con un metro da sarto; è invece 1.772 m se misurata con lo stadio-metro Harpenden. 

SCALA NUMERICA CONTINUA 51.0 49.4 49.0 52.5 51.5 51.8 46.5 47.8 49.7 44.5 49.8 53.0 48.7 50.0 52.9 50.8 46.2 48.9 54.5 48.2 51.2 49.5 56.3 46.0 52.2 47.0 51.1 54.7 52.3 55.0 50.2 50.3 47.7 48.5 53.8 53.4 47.4 50.5 51.7 44.4 49.2 54.0 50.9 51.6 52.7 Lunghezza supina (cm) in un campione di 60 neonati. Valori ottenuti con l'infantometro Harpenden. frequenza limiti di classe valore centrale Assoluta Cumulata 44.25 - 45.75 45.0 2 45.75 - 47.25 46.5 5 7 47.25 - 48.75 48.0 14 48.75 - 50.25 49.5 28 50.25 - 51.75 51.0 16 44 51.75 - 53.25 52.5 9 53 53.25 - 54.75 54.0 58 54.75 - 56.25 55.5 1 59 56.25 - 57.75 57.0 60 

SCALA NUMERICA CONTINUA Stima dell'incidenza e mortalità per tumore nelle Regioni Italiane. (Centro di riferimento oncologico di Aviano, 1990) Maschi; Sede del tumore Femmine 10% vie aereo-digestive superiori 3% ---- mammella 27% 23% polmone 6% 8% stomaco 7% fegato e pancreas 5% 12% colon-retto 14% vescica e rene 9% prostata ovaio e utero leucemie e linfomi 12%; altri tumori; 18% a) La principale causa di morte tra le donne è il tumore alla mammella. b) Nei maschi, tra 100 casi di tumore 23 sono casi di tumore al polmone. c) Il 9% dei maschi sviluppa un tumore alla prostata. d) Globalmente l'incidenza dei tumori è la stessa nei maschi e nelle femmine; e) La localizzazione dei tumori è simile nei due sessi.  continua