QUANTILI
Quantili Quantili Un quantile-p, dove p[0,1] è quel valore che divide una distribuzione statistica in p parti uguali, ognuna delle quali contiene la p-esima parte della numerosità della distribuzione totale E’ un numero più grande del 100 x p % dei valori osservati e più piccolo del restante 100 (1-p) %. Es. Un quantile di 0,1 deve essere un valore che lascia a sinistra il 10% delle osservazioni e a destra il rimanente 90%
Quantili Se p= 4 Quartili: dividono la distribuzione in quattro parti uguali Se p=10 Decili: dividono la distribuzione in dieci parti uguali Se p=100 Percentili: dividono la distribuzione in cento parti uguali In generale si definisce -percentile quel valore a destra del quale cade (1- )% dei casi e a sinistra l’ % dei casi. (p=0,01, 0,02…..0,99) La mediana si può considerare il 2° quartile e il 50° percentile. Quartili Le quattro distribuzioni individuate dai quartili contengono ognuna il 25% della numerosità totale. Così il 1° quartile contiene il 25% e la distribuzione rimanente è il 75% del totale
Il box plot Q3+1.5IR 3° quartile mediana 1° quartile Q1-1.5IR
Il box plot è un grafico caratterizzato da tre elementi principali: 1. Una linea o un punto, che indicano la posizione del centro della distribuzione (mediana); 2. Un rettangolo (box) la cui altezza indica la variabilità dei valori “prossimi” alla media (IR= terzo quartile-primo quartile); 3. Due segmenti (baffi) che partono dai lati minori del rettangolo e che terminano in corrispondenza del più piccolo e del più grande valore non outlier. 4. Dei punti, detti outliers, che giacciono 1,5*IR al di sotto del primo quartile e 1,5*IR al di sopra del terzo quartile
Asimmetria di una distribuzione
Asimmetria negativa o a sx Asimmetria positiva o a dx Mo Mo Me
Distribuzione simmetrica Mo= Me= M
Indici di asimmetria Asimmetria positiva Asimmetria negativa Indice assoluto sulla base dei quartili Asimmetria positiva Asimmetria negativa Indice relativo sulla base dei quartili Indice relativo sulla base degli Scostamenti Poco sensibile Più sensibile perché sfrutta tutte le osservazioni
>0 se Asimmetria positiva <0 se Asimmetria negativa Indici di asimmetria di Pearson L’indice β è più sensibile dell’indice sk perchè si basa sugli scarti dalla media >0 se Asimmetria positiva =0 simmetrica <0 se Asimmetria negativa