La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

1 Lez. 3 - Gli Indici di VARIABILITA - Campo di variazione -Scarto dalla media -Varianza -Scarto quadratico medio -Coefficiente di variazione Elementi.

Presentazioni simili


Presentazione sul tema: "1 Lez. 3 - Gli Indici di VARIABILITA - Campo di variazione -Scarto dalla media -Varianza -Scarto quadratico medio -Coefficiente di variazione Elementi."— Transcript della presentazione:

1

2 1 Lez. 3 - Gli Indici di VARIABILITA - Campo di variazione -Scarto dalla media -Varianza -Scarto quadratico medio -Coefficiente di variazione Elementi di Statistica descrittiva

3 2 Indici di Variabilità I valori medi sono indici importanti per la descrizione sintetica di un fenomeno statistico Hanno però il limite di non darci alcuna informazione sulla distribuzione dei dati

4 3 Esempio In tre differenti prove di matematica 4 studenti hanno riportato le seguenti valutazioni In tutte e tre le prove la media è 6,25 ma i dati sono chiaramente distribuiti in modo diverso

5 4 Diagramma di distribuzione delle tre prove

6 5 nel caso della 1 a prova e 2 a prova sarà opportuno fare un recupero per alcuni studenti nel caso della 3 a prova linsegnante può ritenere che gli obiettivi siano stati raggiunti dalla classe, anche se ad un livello solo sufficiente

7 6 Campo di variazione (Range) Scarto medio dalla media Varianza e scarto quadratico medio Coefficiente di variazione In statistica è possibile valutare in modo sintetico la distribuzione dei dati mediante gli indici di variabilità (o dispersione) Vedremo i seguenti indici

8 7 Campo variazione = x max – x min Campo di variazione E il più semplice degli indici di variazione: Si calcola facendo la differenza tra il dato più grande e il dato più piccolo Rappresenta lampiezza dellintervallo dei dati

9 8 Esempio Consideriamo le valutazioni della prima prova Xmax = 9; Xmin = 3 Range = 9 – 3 = 6

10 9 Calcoliamo il Range per tutte le tre prove Range 1 a prova = 6 dati più dispersi, risultati più eterogenei Range 3 a prova = 1 dati più concentrati, risultati più omogenei Range 2 a prova = Range 1 a prova = 6 Stessa Distribuzione?

11 10 Vediamo graficamente

12 11 Osservazioni: 1. Il campo di variazione dà informazioni sulla distribuzione dei dati: più R è piccolo più i dati sono concentrati; più R è grande più i dati sono dispersi. 2. R è espresso nella stessa unità di misura dei dati 3. Tuttavia R tiene conto solo dei dati estremi della distribuzione e non di tutti i dati, pertanto distribuzioni diverse ma con gli stessi valori estremi hanno range uguali Es. Range 1 a prova = Range 2 a prova. ma distribuzione 1 a prova Distribuzione 2 a prova

13 12 Scarto medio dalla media aritmetica Un altro modo per calcolare la variabilità dei dati (tenendo conto di tutti i dati) consiste nel calcolare la distanza di tutti i dati dalla media e fare la media aritmetica di tali distanze Scarto medio = Distanza media dei dati dalla media

14 13 Esempio Consideriamo le valutazioni della prima prova x 1 = 3 – 6,25 = 3,25; x 2 = 5 – 6,25 = 1,25; x 3 = 8 – 6,25 = 1,75; x 4 = 9 – 6,25 = 2,75; Sm = 3,25 + 1,25 + 1,75 + 2,75 = 2,25 4

15 14 Calcoliamo lo Scarto medio per tutte le tre prove Scarto 1 a prova = 2,25 dati più dispersi, risultati più eterogenei Scarto 3 a prova = 0,38 dati più concentrati, risultati più omogenei Scarto 2 a pr. Scarto 1 a pr. Le Distribuzioni Differiscono

16 15 Diagramma degli scarti dalla media

17 16 Osservazioni: 1. Lo scarto medio dalla media dà informazioni sulla distribuzione dei dati: più S M è piccolo più i dati sono concentrati; più S M è grande più i dati sono dispersi. 2. S M è espresso nella stessa unità di misura dei dati 3. Non ha l'inconveniente del Campo di variazione in quanto S M tiene conto di tutti i dati della distribuzione

18 17 Varianza e Scarto quadratico medio Sono gli indici di variabilità più utilizzati, e tengono conto della distribuzione di tutti i dati. Varianza Rappresenta la media aritmetica dei quadrati delle distanze dei dati dalla media M

19 18

20 19 Esempio - Varianza Consideriamo le valutazioni della prima prova ( x 1 ) 2 = (3 – 6,25 ) 2 = 10,5625; ( x 2 ) 2 = (5 – 6,25 ) 2 = 1,5625; ( x 3 ) 2 = (8 – 6,25 ) 2 = 3,0625; ( x 4 ) 2 = (9 – 6,25 ) 2 = 7,5625; 2 = 10,5625+1,5625+3,0625+7,5625 = 5,6875 4

21 20 Calcoliamo la Varianza per tutte le tre prove Varianza 1 a prova = 5,69 dati più dispersi, risultati più eterogenei Varianza 3 a prova = 0,19 dati più concentrati, risultati più omogenei Varianza 2 a pr. Varianza 1 a pr Le Distribuzioni Differiscono

22 21 Scarto quadratico medio o Deviazione standard È uguale alla radice quadrata della varianza

23 22 Esempio - Scarto quadratico medio Riprendiamo le valutazioni della prima prova

24 23 Calcoliamo lo Scarto quadratico medio per tutte le prove Scarto q. 1 a prova = 2,38 dati più dispersi, risultati più eterogenei Scarto q. 3 a prova = 0,43 dati più concentrati, risultati più omogenei Scarto q. 2 a pr. Scarto q. 1 a pr Le Distribuzioni Differiscono

25 24 Osservazioni: 1. La varianza 2 e lo scarto quadratico medio danno informazioni sulla distribuzione dei dati: più 2 e sono piccoli più i dati sono concentrati; più 2 e sono grandi più i dati sono dispersi. 2. Entrambi gli indici tengono conto di tutti i dati della distribuzione

26 25 3. Entrambi si basano sulla proprietà della media per cui la somma dei quadrati degli scarti dalla media è minima 4. La varianza è espressa mediante il quadrato dellunità di misura dei dati 5. Lo scarto quadratico nella stessa unità di misura dei dati e pertanto viene preferito alla varianza

27 26 Il coefficiente di variazione CV Il CV è una misura relativa di dispersione (le precedenti sono misure assolute) ed è una grandezza adimensionale. E particolarmente utile quando si devono confrontare le distribuzioni di due gruppi con medie molto diverse o con dati espressi in scale differenti (es. confronto tra variazione del peso e variazione dellaltezza).

28 27 Se i valori di CV sono esterni a quelli indicati o si è in presenza di errori di rilevazione, oppure il fenomeno presenta aspetti particolari. se CV è molto basso (2 – 3 %) bisogna sospettare lesistenza di fattori limitanti la variabilità, se CV è molto alto (intorno al 40% o più) è molto probabile lesistenza di fattori che aumentano la variabilità In natura il coeff. di variazione tende a rimanere costante per ogni fenomeno: i valori normalmente variano dal 5% al 15%

29 28 Calcoliamo il Coeff. di variazione delle tre prove CV 1 a prova = 38,16% dati più dispersi, risultati più eterogenei CV 3 a prova = 6,93% dati più concentrati, risultati più omogenei CV 2 a pr. CV 1 a pr Le Distribuzioni Differiscono

30 29 Le misure di Forma Sono indici sintetici utilizzati per evidenziare particolarità nella forma della distribuzione. Noi esamineremo: lasimmetria lasimmetria la curtosi la curtosi

31 30 Asimmetria Una distribuzione è simmetrica quando la sua curva di frequenza presenta un asse di simmetria In una distribuzione simmetrica media, mediana e moda sono coincidenti. media = mediana = moda In una distribuzione asimmetrica media, mediana e moda non sono più coincidenti e proprio la differenza (distanza) tra la media e la moda può essere considerata una misura della asimmetria

32 31 Un altro coeff di asimmetria è il Coeff. di asimmetria (di Fisher) = scarto quadratico medio Se a = 0 distribuzione simmetrica Se a > 0 asimmetria destra Se a < 0 asimmetria sinistra Sono state proposte diverse misure dell asimmetria, per esempio le più semplici sono: Dette rispettivamente: primo e secondo coeff. di asimmetria di Pearson

33 32 moda < mediana < media Asimmetria positiva (as. Destra) La distribuzione è asimmetrica quando non presenta nessun asse di simmetria. Si ha unasimmetria positiva o destra quando il ramo destro della curva è più lungo di quello sinistro In questo caso si ha: media=63,65 moda = 48 mediana =58

34 33 media < mediana < moda Asimmetria negativa (as. Sinistra) Si ha unasimmetria negativa o sinistra quando il ramo sinistro della curva è più lungo di quello destro In questo caso si ha: media = 85,24 moda = 100 mediana = 90

35 34 Curtosi Se una distribuzione è simmetrica o quasi simmetrica allora può esser più o meno appuntita o più o meno appiattita rispetto alla distribuzione normale (o di Gauss) Se la curva è curva Leptocurtica più appuntita si dice curva Leptocurtica curva Platicurtica più appiattita si dice curva Platicurtica Coeff. di curtosi di Pearson = scarto quadratico medio 0 K < + inf Se K = 3 distribuzione normale se K > 3 curva leptocurtica Se K < 3 curva platicurtica.

36 35 Curtosi leptocurtosi K = 8,57 platicurtosi K = 2,8 curva normale K = 3

37 36 Curtosi Spesso il coeff. di curtosi viene indicato con b 2 che, come visto, nel caso della distribuzione normale è = 3 pertanto, talvolta, la curtosi viene indicata con (b 2 – 3) Allora: se la distribuzione è normale (b 2 – 3 ) = 0 se la distribuzione è leptocurtica (b 2 – 3 ) > 0 se la distribuzione è platicurtica (b 2 – 3 ) < 0

38 Esercizio 5 Il numero dei visitatori di un museo nei diversi giorni delle 4 settimane di ottobre sono stati i seguenti: 1^ sett.: 12, 15, 14, 10, 15, 13, 20 2^ sett.: 3, 23, 5, 6, 31, 13, 7 3^ sett.: 10, 12, 10, 11, 12, 15, 11 4^ sett.: 5, 7, 8, 4, 21, 33, 40 Inserisci i dati in una tabella e crea un grafico significativo. Poi calcola, per ogni settimana, la media, il campo di variazione, lo scarto semplice medio e la deviazione standard. Scrivi poi le tue osservazioni/conclusioni.

39 38 Fine Lezione


Scaricare ppt "1 Lez. 3 - Gli Indici di VARIABILITA - Campo di variazione -Scarto dalla media -Varianza -Scarto quadratico medio -Coefficiente di variazione Elementi."

Presentazioni simili


Annunci Google