Lez. 3 - Gli Indici di VARIABILITA’ Elementi di Statistica descrittiva Lez. 3 - Gli Indici di VARIABILITA’ - Campo di variazione Scarto dalla media Varianza Scarto quadratico medio Coefficiente di variazione 1
Indici di Variabilità I valori medi sono indici importanti per la descrizione sintetica di un fenomeno statistico Hanno però il limite di non darci alcuna informazione sulla distribuzione dei dati 2 2
In tutte e tre le prove la media è 6,25 Esempio In tre differenti prove di matematica 4 studenti hanno riportato le seguenti valutazioni In tutte e tre le prove la media è 6,25 ma i dati sono chiaramente distribuiti in modo diverso 3
Diagramma di distribuzione delle tre prove 4
nel caso della 1a prova e 2a prova sarà opportuno fare un recupero per alcuni studenti nel caso della 3a prova l’insegnante può ritenere che gli obiettivi siano stati raggiunti dalla classe, anche se ad un livello solo sufficiente 5 5
In statistica è possibile valutare in modo sintetico la distribuzione dei dati mediante gli indici di variabilità (o dispersione) Vedremo i seguenti indici Campo di variazione (Range) Scarto medio dalla media Varianza e scarto quadratico medio Coefficiente di variazione 6
Campo variazione = x max – x min Campo di variazione E’ il più semplice degli indici di variazione: Si calcola facendo la differenza tra il dato più grande e il dato più piccolo Campo variazione = x max – x min Rappresenta l’ampiezza dell’intervallo dei dati 7
Xmax = 9; Xmin = 3 Range = 9 – 3 = 6 Esempio Consideriamo le valutazioni della prima prova Xmax = 9; Xmin = 3 Range = 9 – 3 = 6 8
Calcoliamo il Range per tutte le tre prove Range 1a prova = 6 dati più dispersi, risultati più eterogenei Range 3a prova = 1 dati più concentrati, risultati più omogenei Range 2a prova = Range 1a prova = 6 Stessa Distribuzione? 9
Vediamo graficamente 10
ma distribuzione 1a prova Distribuzione 2a prova Osservazioni: 1. Il campo di variazione dà informazioni sulla distribuzione dei dati: più R è piccolo più i dati sono concentrati; più R è grande più i dati sono dispersi. 2. R è espresso nella stessa unità di misura dei dati 3. Tuttavia R tiene conto solo dei dati estremi della distribuzione e non di tutti i dati, pertanto distribuzioni diverse ma con gli stessi valori estremi hanno range uguali Es. Range 1aprova = Range 2a prova. ma distribuzione 1a prova Distribuzione 2a prova 11
Scarto semplice medio Un altro modo per calcolare la variabilità dei dati (tenendo conto di tutti i dati) consiste nel calcolare la distanza di tutti i dati dalla media e fare la media aritmetica di tali distanze Scarto medio = Distanza media dei dati dalla media 12
Consideriamo le valutazioni della prima prova Esempio Consideriamo le valutazioni della prima prova x1 = 3 – 6,25 = 3,25; x2 = 5 – 6,25 = 1,25; x3 = 8 – 6,25 = 1,75; x4 = 9 – 6,25 = 2,75; Sm = 3,25 + 1,25 + 1,75 + 2,75 = 2,25 4 13
Calcoliamo lo Scarto medio per tutte le tre prove Scarto 1a prova = 2,25 dati più dispersi, risultati più eterogenei Scarto 3a prova = 0,38 dati più concentrati, risultati più omogenei Scarto 2a pr. Scarto 1a pr. “Le Distribuzioni Differiscono” 14
Diagramma degli scarti dalla media 15
Osservazioni: 1. Lo scarto semplice medio dalla media dà informazioni sulla distribuzione dei dati: più SM è piccolo più i dati sono concentrati; più SM è grande più i dati sono dispersi. 2. SM è espresso nella stessa unità di misura dei dati 3. Non ha l'inconveniente del “Campo di variazione” in quanto SM tiene conto di tutti i dati della distribuzione 16
Varianza e Scarto quadratico medio Sono gli indici di variabilità più utilizzati, e tengono conto della distribuzione di tutti i dati. Varianza Rappresenta la media aritmetica dei quadrati delle distanze dei dati dalla media M 17
18
Consideriamo le valutazioni della prima prova Esempio - Varianza Consideriamo le valutazioni della prima prova (x1)2 = (3 – 6,25 )2 = 10,5625; (x2)2 = (5 – 6,25 )2 = 1,5625; (x3)2 = (8 – 6,25 )2 = 3,0625; (x4)2 = (9 – 6,25 )2 = 7,5625; 2 = 10,5625+1,5625+3,0625+7,5625 = 5,6875 4 19
Calcoliamo la Varianza per tutte le tre prove Varianza 1aprova = 5,69 dati più dispersi, risultati più eterogenei Varianza 3a prova = 0,19 dati più concentrati, risultati più omogenei Varianza 2a pr. Varianza 1a pr “Le Distribuzioni Differiscono” 20
Scarto quadratico medio o Deviazione standard È uguale alla radice quadrata della varianza 21
Esempio - Scarto quadratico medio Riprendiamo le valutazioni della prima prova 22
Calcoliamo lo Scarto quadratico medio per tutte le prove Scarto q. 1aprova = 2,38 dati più dispersi, risultati più eterogenei Scarto q. 3aprova = 0,43 dati più concentrati, risultati più omogenei Scarto q. 2a pr. Scarto q. 1a pr “Le Distribuzioni Differiscono” 23
Osservazioni: 1. La varianza 2 e lo scarto quadratico medio danno informazioni sulla distribuzione dei dati: più 2 e sono piccoli più i dati sono concentrati; più 2 e sono grandi più i dati sono dispersi. 2. Entrambi gli indici tengono conto di tutti i dati della distribuzione 24
3. Entrambi si basano sulla proprietà della media per cui la somma dei quadrati degli scarti dalla media è minima 4. La varianza è espressa mediante il quadrato dell’unità di misura dei dati 5. Lo scarto quadratico nella stessa unità di misura dei dati e pertanto viene preferito alla varianza 25