La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

ANALISI DELLE DISTRIBUZIONI STATISTICHE

Presentazioni simili


Presentazione sul tema: "ANALISI DELLE DISTRIBUZIONI STATISTICHE"— Transcript della presentazione:

1 ANALISI DELLE DISTRIBUZIONI STATISTICHE
L’Analisi delle Distribuzioni Statistiche consiste nell’elaborazione matematica dei dati statistici. Lo scopo è quello di ricavare tutte le informazioni sintetiche più importanti che riguardano i dati raccolti. Indici di Posizione: Medie Algebriche Def. Media secondo Chisini Dato un insieme di dati statistici x1,…,xn, ed una funzione obiettivo f (x1,..,xn) , si chiama valore medio M qualunque valore tale che f (x1,..,xn) =f (M,…M) Oss. Sostituendo a ciascun dato statistico il valore M abbiamo che il valore assunto dalla funzione obiettivo non cambia, resta cioè invariato Consideriamo nelle seguenti definizioni un insieme statistico di dati nella forma x1,…,xn Proprietà Generali della Media Conservazione unità di misura : stessa u.d.m. del dato statistico Monotonia: se due distribuzioni sono una minore dell’altra termine a termine allora le medie devono stare nello stesso ordine Consistenza : se una distribuzione è fatta da termini costanti allora la media deve essere uguale a tale costante Internalità: la media deve essere compresa tra il minimo ed il massimo

2 Indici di Posizione: Medie Aritmetiche
Def. Media Aritmetica Semplice Funzione obiettivo: Def. Media Aritmetica Ponderata Per ogni dato statistico x1,..,xn consideriamo i pesi relativi f1,..,fn . Allora: Funzione obiettivo:

3 Indici di Posizione: Medie Aritmetiche
Def. Scarti dalla Media Oss. Possono essere positivi, nulli, negativi Teo. La somma degli scarti dalla media è sempre nulla Dim.(*) Teo. La somma degli scarti dalla media al quadrato è minima (rispetto alla media) Dim.(*) Sia M la media aritmetica ed M’ un altro valore diverso da M. Allora definiti: Dobbiamo mostrare che: (*) Come esercizio mostrare la validità dei teoremi per le medie aritmetiche pesate

4 Indici di Posizione: Medie Aritmetiche
Dim. (cont.) Sia d=M-M’, da cui Essendo c.v.d. Calcolo della media aritmetica (ponderata) nel caso di una distribuzione per classe (variabili continue) Classi di età Numero persone 20-25 10 25-30 15 30-35 20 35-40 11 40-45 3 45-50 1 totale 60 Basta considerare per ciascuna classe il termine centrale

5 Indici di Posizione: Medie Aritmetiche
Classi di età Numero persone 20-25 10 25-30 15 30-35 20 35-40 11 40-45 3 45-50 1 totale 60 Classi di età Valore Centrale(x_i) Frequenze (f_i) x_i*f_i Pesi (p_i) x_i*p_i 20-25 22,5 10 225 0,1667 3,75 25-30 27,5 15 412,5 0,2500 6,875 30-35 32,5 20 650 0,3333 10,833 35-40 37,5 11 0,1833 40-45 42,5 3 127,5 0,0500 2,125 45-50 47,5 1 0,0167 0,7917 somma 60 1875 31,25 Media

6 Trasformazione di Variabili Statistiche
Sia data la variabile statistica X da essa è possibile creare, mediante operazioni algebriche, le seguenti variabili statistiche: X+k aX aX+k Xn Es. (Excel)

7 Trasformazione di Variabili Statistiche e Media Aritmetica
Per quanto detto sinora, se consideriamo lo scarto come variabile statistica S= X-M abbiamo da quanto precedentemente enunciato che la media aritmetica degli scarti è zero. Indichiamo questo fatto con: m(S)=0. In generale allora m(X) sarà il valor medio della variabile statistica X. Se abbiamo una costante sarà m(k)=k. Il fatto che m(S)=0 può essere visto come m(X-M)=0, la qual cosa lascia intuire la possibilità di un comportamento “lineare” del valor medio aritmetico: m(X-M)=m(X)-m(M)=M-M=0 Proprietà della Media Aritmetica E quindi:

8 Trasformazione di Variabili Statistiche e Media Aritmetica
Proprietà della Media Aritmetica Dim. con Proprietà della Media Aritmetica Dim. Def. Momenti ( di una variabile statistica) Momento di ordine k:

9 Momenti di una variabile statistica
Oss. Indichiamo i momenti di ordine k con mk Il momento di ordine 1, m1 è la media aritmetica. Importanti sono il momento di ordine 2 e 3 , m2 ed m3 In particolare si ha sempre: m2- (m1)2≥0 Es. (excel- 02a) x_i f_i x_i*f_i x_i^2 f_i*x_i^2 x_i^3 f_i*x_i^3 1 3 2 4 8 16 32 9 27 81 5 20 80 64 320 25 125 625 totali 65 55 251 225 1061 m_1 3,25 m_2 12,55 m_2-(m_1)^2 1,988 m_3 53,05

10 Indici di Posizione: Medie Geometriche
Def. Media Geometrica Semplice Funzione obiettivo: Def. Media Geometrica Ponderata Per ogni dato statistico x1,..,xn consideriamo i pesi relativi f1,..,fn . Allora: Funzione obiettivo:

11 Indici di Posizione: Medie Quadratiche
Def. Media Quadratica Semplice Funzione obiettivo: Def. Media Quadratica Ponderata Per ogni dato statistico x1,..,xn consideriamo i pesi relativi f1,..,fn . Allora: Funzione obiettivo:

12 Indici di Posizione: Medie Armonica
Def. Media Armonica Semplice Funzione obiettivo: Def. Media Armonica Ponderata Per ogni dato statistico x1,..,xn consideriamo i pesi relativi f1,..,fn . Allora: Funzione obiettivo:

13 Indici di Posizione: Medie di Potenza k
Def. Media di Potenza k Semplice Funzione obiettivo: Def. Media di Potenza k Ponderata Per ogni dato statistico x1,..,xn consideriamo i pesi relativi f1,..,fn . Allora: Funzione obiettivo:

14 Medie Algebriche Oss. M1  media aritmetica M2  media quadratica
M3  media cubica M-1  media armonica Si dimostra che; Per le medie algebriche abbiamo la seguente relazione: Es. Excel (02-a)

15 Teoremi sulla Medie Teo Dim.

16 Teoremi sulla Medie Teo Dim. poiché

17 Teoremi sulla Medie Teo Dim. Oss

18 Teoremi sulla Medie Teo Dim. Oss

19 Medie: andamento Grafico

20 Indici di Posizione: Moda
Def. Si chiama Moda o Valore Modale di una distribuzione il valore a cui corrisponde la massima frequenza. Se tale valore non è unico si parla di distribuzione plurimodale. Distribuzione in classi: Se tutte le classi hanno la stessa ampiezza si parla di classe (o classi) modale. Se le classi hanno ampiezze diverse ( si deve dividere la frequenza per l’ampiezza della classe) per cui la classe ( o le classi) modale è quella a cui corrisponde il maggior rapporto frequenza/ampiezza. Classi Freq Ampiezza Freq/ampiezza 0-100 5000 100 50 6500 65 12300 200 61,5 14200 71 18400 400 46 classe Modale

21 Indici di Posizione: Mediana
Def. Si chiama Mediana il termine che occupa il posto centrale nella distribuzione quando i dati sono disposti in ordine crescente. Se non esiste il termine centrale perché i dati sono in numero pari, si prende la media aritmetica dei due centrali. Es. 3,6,8,15,21  mediana 8 Es. 2,7,21,32,45,48  mediana (21+32)/2 = 26.5 Se le distribuzioni sono ponderate, si utilizzano le frequenza cumulate. Si guarda il termine la cui frequenza cumulata supera la semisomma delle frequenze. Ad esso corrisponde la mediana. Termini Freq Freq. Cum. 20 12 21 32 22 18 50 23 7 57 26 2 59 30 1 60 totale Mediana

22 Indici di Posizione: Mediana
Se le distribuzioni sono per classi (supponendo tutte le classi con la medesima ampiezza, in caso contrario si considerano i rapporti frequenza/ampiezza al posto della sola frequenza) si individua la classe mediana mediante le frequenze cumulate e poi mediante una proporzione si stabilisce qual’è il termine mediano. Classi Freq. Freq. Cumulate 20-30 60 30-40 92 152 40-50 114 266 50-60 86 352 60-70 40 392 70-80 8 400 La classe mediana è Il termine mediano sarà 40+x, dove x soddisfa alla proporzione: x:10=( ):114 10= ampiezza classe = ½ somma freq. 152= freq. cumulata classe precedente 114= freq. classe mediana Ne consegue x=4,21 e quindi mediana = 44,21. Proprietà Mediana La somma dei valori assoluti degli scarti dalla mediana è minima

23 Indici di Posizione: Mediana
In generale vale la formula: Con: l1 = limite inferiore della classe mediana N = frequenza cumulata complessiva F = frequenza cumulata fino alla classe mediana f = frequenza (non cumulata) della classe mediana a = ampiezza della classe mediana

24 Dipendenza Indici Statistici dalla modalità di presentazione dei dati
I raggruppamenti dei dati in classi comportano una perdita di informazione e quindi uno spostamento degli indici di posizione: Es: x_i f_i 1 1-11 5 3 4 media= 6 11

25 Indici di Posizione: Quartili e Percentili
I quartili ,data una serie di dati statistici ordinati, sono quattro e dividono i dati esattamente in quattro parti egualmente numerose. Indicati con Q1 , Q2, Q3, Q4 Q1 é il valore per cui ¼ dei dati (25%) sono inferiori a Q1 Q2 é il valore per cui ½ dei dati (50%) sono inferiori a Q2 (coincide con la mediana) Q3 é il valore per cui ¾ dei dati (75%) sono inferiori a Q3 Q4 coincide con xn Il concetto di percentile generalizza quello di mediana :  se p è un numero tra 0 e 100, il percentile di ordine p (o p-esimo percentile, se p è intero) è il dato che delimita il primo p% dei dati (ordinati) dai rimanenti dati. Il 25-esimo percentile coincide con il primo quartile Il 50-esimo percentile coincide con il secondo quartile (e quindi con la mediana) Il 75-esimo percentile coincide con il terzo quartile Il 100-esimo percentile coincide con il quarto quartile (e quindi con xn ) Nota: nel caso di distribuzioni con classi si procede come per la determinazione della mediana, mediante l’utilizzo di proporzioni.

26 Indici di Posizione: Quantili
In generale si chiamano quantile di ordine α un valore xα della distribuzione statistica tale i valori minori di xα siano almeno α [o (α*100)% ] e quelli alla destra almeno (1- α) [o (1- α)*100%]. La mediana coincide con il quantile di ordine ½ Il primo quartile con il quantile di ordine ¼ Il 30-esimo percentile con il quantile di ordine 0.3. Quindi: PERCENTILI = QUANTILI*100 DECILI = QUANTILI con α=0.1 CENTILI = QUANTILI con α=0.01 QUARTILI = QUANTILI con α=0.25


Scaricare ppt "ANALISI DELLE DISTRIBUZIONI STATISTICHE"

Presentazioni simili


Annunci Google