Indici di Variabilità NdE Range (o campo di variabilità) Scarto medio assoluto Somma dei quadrati Varianza e deviazione standard
Il concetto di variabilità La variabilità è una misura della dispersione di una distribuzione di frequenza La variabilità determina il grado in cui una singola misura è rappresentativa della popolazione Elevata variabilità Bassa variabilità
Variabilità e statistica inferenziale Nell’assenza di variabilità all’interno dei gruppi è evidente che i Q.I. del primo gruppo sono più elevati rispetto a quelli del secondo gruppo Nella presenza di una forte variabilità all’interno dei gruppi non è evidente in quale gruppo sono più elevati i Q.I.
Indici di variabilità Due distribuzioni possono avere stessi indici di centralità (media, mediana, moda) ma essere diversamente dispersi.
Il campo di variazione o RANGE Il campo di variazione di una distribuzione è la differenza fra il valore massimo e il valore minimo rilevati. Range = Val max- Val min Osservazioni: 1,2,5,7,8,9 Valore massimo: 9 Valore minimo: 1 Campo di variazione: 8
Il campo di variazione come misura della variabilità Il campo di variazione si esprime in valori assoluti. Non dice nulla su come i valori assunti dalla variabile sono distribuiti. Osservazioni di altezza (mm): 1600,1520, 1720,1670, 1700 Osservazioni di peso (kg) 50, 70, 110, 73, 80 Kg.
Scarto medio assoluto dalla media aritmetica Lo scarto medio assoluto dalla media aritmetica è la somma degli scarti dei vari dati rispetto alla loro media aritmetica considerati in valore assoluto. Lo scarto medio assoluto non è altro che la media aritmetica delle distanza di ciascun dato dalla media.
Scarto medio assoluto dalla media aritmetica
Varianza e deviazione standard Valore medio Definizione intuitiva della variabilità: la variabilità come distanza media di un’”osservazione tipo” rispetto al valore medio per la popolazione Alcune distanze sono negative, alcune positive La somma di tutte le distanze è pari a zero La media delle distanze è pari a zero Non possiamo utilizzare la somma delle distanza come misura di dispersione Distanza rispetto alla media
Somma dei quadrati La somma dei quadrati della distanza fra la media (µ) e il valore dell’osservazione L’utilizzo del quadrato Elimina i valori negativi Da maggior peso alle osservazioni lontane dalla media Il valore della somma dei quadrati aumenta con il numero delle osservazioni.
La varianza di una popolazione La varianza si calcola come la media del quadrato della distanza fra il valore della singola osservazione e il valore medio per l’insieme delle osservazioni La varianza è una misura finalizzata alla standardizzazione delle misure di variabilità Il valore della varianza è indipendente rispetto al numero delle osservazioni
La deviazione standard La varianza non costituisce una misura “intuitiva” dalla distanza fra una “osservazione tipica” e il valore medio Tale distanza è rappresentata dalla deviazione standard La deviazione standard di una popolazione è rappresentata dal radice quadrata della varianza della popolazione
Esempio Calcolare la varianza e la deviazione standard del seguente insieme di dati 10,10,10,10,10 1,3,3,4,9
Prima esercitazione Completa assenza di variabilità
Seconda esercitazione
Visualizzare la deviazione standard Questa osservazione è distante 1 Dev. St. rispetto alla media =17,2
La Varianza e la Deviazione Standard La deviazione standard è l’indice normalmente utilizzato per calcolare la dispersione di una distribuzione di dati. Si può affermare che la deviazione standard calcola la “quantità” media di deviazione dalla media. E’ una misura lineare della dispersione dei dati. La varianza è invece una media di aree e non è mai negativa.
La deviazione standard nella letteratura scientifica Forma standardizzata di presentazione forma breve forma tabellare Importante indicare la numerosità di ciascuno dei gruppi e sottogruppi “I bambini che hanno visionato il cartoon hanno mostrato un indice di aggressività (M=12,45, Dev St.=3,7) superiore rispetto al Gruppo di controllo (M=4,22, Dev. St.=1,04)”
Esempio1: distribuzione poco dispersa Peso (kg) Fa Fa*xi scarto Scarto quadrato Scarto quadrato Ponderato 48 0,0 -19,7 388,7 53 -14,7 216,5 55 -12,7 161,7 60 -7,7 59,5 65 24 1560,0 -2,7 7,4 176,8 68 4080,0 0,3 0,1 4,9 70 21 1470,0 2,3 5,2 109,7 74 6,3 39,5 78 10,3 105,8 80 12,3 150,9 84 16,3 265,2 105 7110,0 Somma quadrati 291,4 Media (kg) 67,7 Varianza 2,8 Dev. standard 1,7
Grafico 1: distribuzione poco dispersa
Esempio2: bassa dispersione Peso (kg) Fa Fa*xi Scarto Scarto quadrato Scarto quadrato ponderato 48 0,0 -19,7 389,8 53 -14,7 217,4 55 2 110,0 -12,7 162,4 324,8 60 5 300,0 -7,7 60,0 299,8 65 17 1105,0 -2,7 7,5 127,9 68 54 3672,0 0,3 0,1 3,6 70 20 1400,0 2,3 5,1 101,9 74 370,0 6,3 39,2 195,8 78 156,0 10,3 105,2 210,4 80 12,3 150,2 84 16,3 264,3 Totale 105 7113,0 Somma quadrati 1264,1 Media (kg) 67,7 Varianza 12,0 Dev. Standard (kg) 3,5
Grafico2: bassa dispersione
Esempio3: alta dispersione Peso (kg) Fa Fa*xi Scarto Scarto quadrato Scarto quadrato ponderato 48 2 96,0 -19,7 389,0 778,1 53 5 265,0 -14,7 216,8 1084,0 55 7 385,0 -12,7 161,9 1133,3 60 10 600,0 -7,7 59,7 596,6 65 15 975,0 -2,7 7,4 111,3 68 22 1496,0 0,3 0,1 1,7 70 18 1260,0 2,3 5,2 93,3 74 518,0 6,3 39,4 275,7 78 780,0 10,3 105,6 1056,0 80 400,0 12,3 150,7 753,5 84 4 336,0 16,3 264,9 1059,7 Totale 105 7111,0 Somma quadrati 6943,0 Media (kg) 67,7 Varianza 66,1 Dev. Standard 8,1
Grafico3: alta dispersione
Esempio4: dispersione molto elevata Peso (kg) Fa Fa*xi scarto Scarto quadrato ponderato 48 6 288,0 -19,7 389,8 2338,7 53 8 424,0 -14,7 217,4 1738,8 55 440,0 -12,7 162,4 1299,0 60 9 540,0 -7,7 60,0 539,6 65 585,0 -2,7 7,5 67,7 68 15 1020,0 0,3 0,1 1,0 70 13 910,0 2,3 5,1 66,2 74 11 814,0 6,3 39,2 430,7 78 10 780,0 10,3 105,2 1052,1 80 640,0 12,3 150,2 1201,9 84 672,0 16,3 264,3 2114,4 Totale 105 7113,0 Somma quadrati 10850,1 Media (kg) Varianza 103,3 Dev. Standard (kg 10,2
Grafico4: dispersione molto elevata
Confronto Range – Deviazione standard - Percentili www.quadernodiepidemiologia.it