Indici di variabilità Gli indici di variabilità misurano la dispersione (rispetto alla posizione) la variabilità Gli indici di posizione sono tanto più rappresentativi quanto minore è la dispersione dei dati intorno ad essi. La variabilità è l’attitudine delle osservazioni ad esse diverse l’una dall’altra
Voti Master
La varianza Scarto quadratico medio Essa indica qual è la concentrazione delle osservazioni intorno alla media, fornendo indicazioni sull’ordine di grandezza degli scarti. Scarto quadratico medio
Esempio 4.1 - Varianza (1, 2, 5, 6, 7, 9) Dati: Media dei quadrati degli scarti Differenza fra la media dei quadrati e il quadrato della media Scarto quadratico medio
Varianza da distribuzione di frequenza X assume k valori x1, x2, …, xk con frequenze n1, n2, …, nk
Esempio 4.2 – Varianza Voti in algebra Scarto quadratico medio
Esempio 4.2 – Varianza dei voti in Probabilità Scarto quadratico medio
Varianza da dati raggruppati in classi
Esempio 4.3 – varianza rendimenti
Esempio 4.3 – varianza rendimenti
Coefficiente di variazione Il coefficiente di variazione non dipende dall’unità di misura
Esempio – coefficiente di variazione
MAD Median Absolute Deviation X: x1, x2, … , xn med = median(X) Se la distribuzione è “normale” il MAD approssima lo scarto quadratico medio Non risente dei valori anomali
Esempio - MAD Consumi pro-capite annui di cereali med=72 Scarti ordinati mediana
Differenza interquartile x(1), x(2), … , x(n) Quartili Q1 e Q3 Misura la variabilità della metà centrale dei dati Campo di variazione
Esempio – Differenza interquartile e campo di variazione Carne ( 55, 61, 62, 66, 68, 75, 85, 86, 88, 91, 97, 107, 152, 231, 299, 329 ) Sintesi
Box-plot Il box plot è un grafico utile per rappresentare la distribuzione dei dati Esso è costituito da Una linea in corrispondenza della mediana Un rettangolo da Q1 a Q3 che indica la variabilità della metà centrale dei dati Due segmenti (baffi) che si estendono dai quartili ai valori estremi
Esempio – Box-plot Voti in matematica ( 20, 22, 22, 23, 25, 25, 25, 25, 26, 26, 26, 27, 28, 28 ) Box-plot – Voti in matematica
Confronto fra Box-plot Diversa posizione Diversa variabilità Diversa asimmetria
Consumi di energia Box-plot dei consumi di energia nel Queensland (Australia) nei diversi giorni della settimana, anno 2000.
Classificazione delle osservazioni Obiettivo: identificare i dati anomali Si definisce un intervallo di valori ritenuti nella norma: Recinto interno = (r1, r2) I valori al di fuori del recinto interno sono definiti “osservazioni distanti” Recinto esterno = (R1, R2) I valori al di fuori del recinto esterno sono chiamati “osservazioni molto distanti” Molto distanti distanti nella norma R1 R2 r1 r2
Esempio – Classificazione delle osservazioni (-3, 10, 11, 13, 15, 17, 18, 19, 25, 48) n=10 DQ=8 (10, 25) valori adiacenti: Massimo e minimo all’interno del recinto interno -3 osservazione distante 48 osservazione molto distante
Esempio – Classificazione delle osservazioni (-3, 10, 11, 13, 15, 17, 18, 19, 25, 48) n=10 DQ=8
Box-plot con osservazioni anomale I baffi si estendono fino alle osservazioni adiacenti Le osservazioni anomale sono rappresentate all’esterno del box-plot con simboli diversi
Esempio – Box-plot consumi di carne ( 55, 61, 62, 66, 68, 75, 85, 86, 88, 91, 97, 107, 152, 231, 299, 329 )
Box-Plot – Consumi di carne
Box-plot - Voti Matematica Algebra Probabilità Inferenza E, I, M N, L