La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Statistica descrittiva. Statistica descrittiva: unità statistica, popolazione, caratteri e modalità Lunità statistica è loggetto dellosservazione del.

Presentazioni simili


Presentazione sul tema: "Statistica descrittiva. Statistica descrittiva: unità statistica, popolazione, caratteri e modalità Lunità statistica è loggetto dellosservazione del."— Transcript della presentazione:

1 Statistica descrittiva

2 Statistica descrittiva: unità statistica, popolazione, caratteri e modalità Lunità statistica è loggetto dellosservazione del fenomeno di interesse (es. lindividuo di una popolazione) La popolazione è un insieme di unità che presentano alcune caratteristiche in comune Caratteri: caratteristiche misurate sullunità (es: pressione sanguigna, positività ad un test diagnostico) Ciascun carattere è presente in una unità con una determinata modalità (es. pressione sanguigna=130/75, positività del test diagnostico)

3 Caratteri qualitativi e quantitativi I caratteri possono essere classificati secondo il diverso livello (scala) di misurazione e possono assumere diverse modalità. Caratteri qualitativi: caratteri che descrivono una qualità dellunità statistica. Si distinguono in Nominali o sconnessi (non è possibile stabilire un ordine, es. sesso, gruppo sanguigno, colore degli occhi) Ordinali (è possibile stabilire un ordine, es. stato di salute, livello di istruzione) Caratteri quantitativi: caratteri che possono essere misurati (le modalità sono numeri). Possono essere continui o discreti. Si distinguono in scala di intervalli: variabili che non hanno uno zero assoluto (nella scala di misurazione zero significa assenza di quel carattere, es. scale di misurazione della temperatura, gradimento numerico). scala di rapporti: è possibile calcolare i rapporti tra unità statistiche rispetto (es. pressione sanguigna, peso, altezza, numero di sigarette fumate al giorno)

4 Distribuzioni Leffetto della determinazione delle modalità con cui ognuno dei caratteri si presenta in ciascuna unità del collettivo è la distribuzione del collettivo secondo i caratteri considerati. Caratteri qualitativi: definizione di classi o categorie e conta numerica delle osservazioni che cadono in ciascuna di esse. Caratteri quantitativi: scomposizione dei valori delle osservazioni in intervalli distinti solitamente di uguale ampiezza e conta delle osservazioni che cadono in ciascun intervallo (creazione degli intervalli di classe).

5 Distribuzioni di frequenza idPeso (Kg) 170 265 354 471 570 667 765 845 955 1070 Distribuzione per unità Peso (Kg) nini 451 541 551 652 671 703 711 Distribuzione di frequenze relative Peso (Kg) f 450.1 540.1 550.1 650.2 670.1 700.3 710.1 Distribuzione di frequenze assolute Peso (Kg) F 450.1 540.2 550.3 650.5 670.6 700.9 711 Distribuzione di frequenze cumulative

6 Grafico scatola e baffi Nella scatola è rappresentata la parte centrale della distribuzione, I baffi rappresentano le code, La linea orizzontale è la mediana della distribuzione I punti sono gli outliers (dati anomali) Q1Q1 Q3Q3

7 Istogramma Se la variabile è discreta e non raggruppata in classi, le frequenze si rappresentano con linee verticali. Se la variabile è raggruppata in classi, le frequenze assolute o relative sono proporzionali alle aree delle barre (per non confondersi con classi di ampiezza diversa). Valori o classi della variabile Frequenze di ogni valore o classe

8 Tabelle di contingenza idCaso (1=caso; 0=non caso) Fumo (1=fuma; 0=non fuma) 111 210 300 401 500 611 711 800 911 1010 FumoNon Fumo Caso42 Non caso13 FumoNon Fumo Caso0.40.2 Non caso0.10.3 Nel caso di osservazioni classificate secondo livelli nominali, le frequenze si rappresentano in tabelle di contingenza.

9 Misure di sintesi numerica Media Mediana Misure di tendenza centrale Moda Varianza Deviazione standard Coefficiente di variazioneMisure di Variabilità o Campo di variazionedispersione Differenza interquartile

10 Misure di tendenza centrale di una distribuzione Moda: modalità più frequente nella popolazione (definita per distribuzioni quantitative e qualitative) Mediana: modalità che occupa il posto centrale nella distribuzione. Il calcolo della mediana richiede lordinamento delle unità rispetto alle modalità del carattere. (definita per distribuzioni qualitative ordinate e quantitative) n dispari: la mediana è il valore centrale (n+1)/2 n pari: la mediana è la media dei due valori centrali n/2 e n/2+1 Quartili: modalità che ripartiscono la distribuzione in 4 parti di uguali frequenze Media: è la somma delle modalità diviso la numerosità (definita solo per le distribuzioni quantitative) Distribuzione per unità: Distribuzione di frequenze: (k modalità distinte osservate)

11 Peso (Kg) f 450.1 540.1 550.1 650.2 670.1 700.3 710.1 Moda = 70 Kg (più frequente) Mediana = 66 Kg (media tra la 5° e la 6° modalità) Media = 45 x 0.1+54 x 0.1+…+71 x 0.1 = 63.2 45 54 55 65 67 70 71

12 La variabilità di una distribuzione Moda, media e mediana sono valori sintetici che indicano la tendenza centrale della distribuzione, ma è importante anche misurare la dispersione delle osservazioni intorno al valore centrale. Popolazione A 100 100 100 100 100Media = 100, Var = 0 Popolazione B 110 90 95 100 105Media = 100, Var = 50 Popolazione C 125 115 85 90 85 Media = 100, Var = 280

13 Misure di variabilità La varianza è un indice di dispersione dalla media delle misurazioni. E indicata solitamente con σ 2 (σ è la deviazione standard o scarto quadratico medio). Distribuzione per unità Distribuzione per frequenze (k modalità osservate) Coefficiente di variazione: rapporto tra deviazione standard e media. Essendo un numero puro (adimensionato), è un indice di dispersione che permette di confrontare misure di fenomeni riferite a unità di misura differenti. Campo di variazione : differenza tra il valore massimo e il valore minimo delle osservazioni. Differenza interquartile: differenza tra il primo e il terzo quartile. Si tratta di un indice di variazione e viene a volte usato in alternativa alla deviazione standard

14 Peso (Kg) f 450.1 540.1 550.1 650.2 670.1 700.3 710.1 μ = 45 x 0.1+54 x 0.1+55 x 0.1+65 x 0.2+67 x 0.1+ +70 x 0.3+71 x 0.1=63.2 = (45-63.2) 2 x 0.1+(54-63.2) 2 x 0.1 +(55-63.2) 2 x 0.1 + +(65-63.2) 2 x 0.2+(67-63.2) 2 x 0.1 +(70-63.2) 2 x 0.3 + +(71-63.2) 2 x 0.1 =70.36 = 70.36=8.4 cv = 8.4/63.2=0.13


Scaricare ppt "Statistica descrittiva. Statistica descrittiva: unità statistica, popolazione, caratteri e modalità Lunità statistica è loggetto dellosservazione del."

Presentazioni simili


Annunci Google