La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Indici di tendenza centrale o di posizione Si può operare in due modi: Fornire dei valori intorno ai quali si ritiene sia concentrata la variabile dando.

Presentazioni simili


Presentazione sul tema: "Indici di tendenza centrale o di posizione Si può operare in due modi: Fornire dei valori intorno ai quali si ritiene sia concentrata la variabile dando."— Transcript della presentazione:

1 Indici di tendenza centrale o di posizione Si può operare in due modi: Fornire dei valori intorno ai quali si ritiene sia concentrata la variabile dando quindi unidea sintetica del fenomeno Valori Medi; Scegliere alcuni valori caratteristici, strategici della distribuzione Indici di Posizione o Medie lasche.

2 La media DEFINIZIONE (dovuta a Cauchy nel 1821): Una media M è quel valore tale che dove x (1) e x (N) sono il valore minimo e massimo di X. DEFINIZIONE (dovuta a Chisini nel 1929): Una media M di un carattere X è quel valore che sostituito alle singole modalità del carattere, soddisfa la seguente uguaglianza: dove f è una opportuna funzione matematica.

3 La media aritmetica Intensità totale E lindice più noto e usato. E definita come quel valore, nellottica di Chisini, che lascia inalterata lintensità totale del carattere delle N unità della popolazione, cioè:

4 La media aritmetica Quindi sostituendo si ha:

5 La media aritmetica dove si ricorda che : e x i per i=1,2,...,k sono le modalità del carattere. Se abbiamo a disposizione una distribuzione di frequenze assolute o relative, la media si scrive:

6 La media aritmetica e poi si calcola la media aritmetica come nei casi precedenti, utilizzando il valore centrale: Media di distribuzioni per classi di valori Se il carattere osservato è quantitativo continuo e la distribuzione è in classi di valore non è possibile applicare direttamente la formula precedente, ma sarà necessario sintetizzare ciascuna classe mediante il suo valore centrale:

7 La media aritmetica Come si costruiscono le classi: Classi aperte; Classi chiuse inferiormente; Classi chiuse superiormente. Non è necessario che le classi abbiano tutte la stessa ampiezza.

8 Le proprietà della media aritmetica 1.La media aritmetica rappresenta il baricentro della distribuzione, cioè quel valore per cui la sua intensità totale risulta equamente ripartita fra la totalità delle unità statistiche; 2.La somma degli scarti dalla media aritmetica è sempre nulla: Infatti:

9 Le proprietà della media aritmetica 4.Sia data una variabile statistica X di media aritmetica μ, allora: M(aX+b)= aμ+b dove M è la media aritmetica. Infatti:

10 Le proprietà della media aritmetica Consideriamo le tre formulazioni della media aritmetica: non sono tre formule differenti ma tre modi di calcolare la media aritmetica a seconda dei dati a disposizione.

11 Un esempio Data la seguente distribuzione del numero di figli in 23 famiglie di un condominio di Pescara: Numero di figli in 23 famiglie nini Totale23

12 Un esempio Per il calcolo della media aritmetica ci aiutiamo con la seguente tabella: Numero di figli in 23 famiglie nini xini xini Totale2344 Pertanto la media aritmetica è pari a:

13 La media aritmetica ponderata Nella media aritmetica le modalità (quindi le unità statistiche) concorrono alla pari nelle determinazione della media; infatti ogni modalità vale 1/N. Tuttavia esistono numerose situazione reali dove le unità statistiche possiedono importanza differenti tra loro. Quindi, è necessario definire la media aritmetica ponderata.

14 La media aritmetica ponderata dove p i è il peso dellunità i-esima Sia carattere X allora possiamo definire la media aritmetica ponderata come: una distribuzione unitaria di un

15 La media aritmetica ponderata ESEMPIO : Sia data la seguente tabella di esami e relativi crediti dello studente Paolo dellUniversità di Chieti - Pescara Voti e Crediti VotoCFU Statistica285 Diritto Privato226 Diritto Pubblico246 Macroeconomia258 Informatica305

16 La media aritmetica ponderata E ovvio che in questa situazione è necessario calcolare la media aritmetica ponderata perché non tutti gli esami valgono nella stessa maniera in termini di CFU. VotoCFUVoto*CFU Statistica Diritto Privato Diritto Pubblico Macroeconomia Informatica305150

17 La media aritmetica ponderata

18 Le medie lasche Si chiamano medie lasche quei particolari indici che, per sinterizzare lintera distribuzione in una misura di posizione, si basano solo su alcuni valori della distribuzione. In particolare considereremo: il valore centrale; la mediana; i quartili ed i percentili; la moda

19 Il valore centrale Il valore centrale è dato dalla semisomma dei valori estremi della distribuzione: dove ovviamente sono rispettivamente il più piccolo ed il più grande valore osservato. Ovviamente C dipende esclusivamente dai due valori estremi.

20 La mediana La mediana è un indice che dipende dallordine delle osservazioni e non dal loro valore (quindi può essere calcolata per qualsiasi carattere almeno ordinato). Sia popolazione secondo un carattere ordinato X. una distribuzione unitaria di una Si definisce mediana Me(X) la modalità che bipartisce la distribuzione ordinata in senso non decrescente

21 Il calcolo della mediana Se N è dispari, alla modalità che si trova nella posizione (N+1)/2, cioè: Se N è pari, alle modalità che si trovano nella posizione (N/2) e (N/2)+1, cioè: Se si dispone di una distribuzione unitaria ordinata secondo un ordinamento non decrescente allora la mediana di X corrisponde

22 Il calcolo della mediana Si noti che se non coincidono, la mediana può non essere unica. Nel caso di variabili quantitative con N pari, si può avere anche un intervallo di valori che soddisfano alla definizione di mediana. In questo caso, si può prendere il punto medio come mediana convenzionale.

23 Un esempio Consideriamo la seguente distribuzione dei voti ottenuti da 7 studenti nellesame di statistica: Queste osservazioni risultano già ordinate, nel caso contrario dovremmo prima ordinarle. Vi sono N=7 osservazioni, quindi N dispari, allora la mediana coincide con losservazione di posto (N+1)/2=(7+1)/2=4. Cioè:

24 Un esempio Ora consideriamo, invece, la distribuzione dei voti ottenuti da 8 studenti nellesame di statistica: Anche in questo caso i valori sono già ordinati. Vi sono 8 osservazioni, quindi N è pari. Quindi le due modalità mediane sono e

25 Il calcolo della mediana Se non si dispone della distribuzione unitaria, ma soltanto della distribuzione di frequenza assoluta corrispondente, si può operare nel seguente modo. Sia X un carattere e sia, ad esempio, la distribuzioni di frequenza assoluta Allora la mediana corrisponde

26 Il calcolo della mediana se N è dispari, alla modalità x i che presenta la frequenza assoluta cumulata N i più piccola tale che: N i (N +1)/2; se N è pari, alla modalità x i che presenta la frequenza assoluta cumulata N i più piccola tale che: N i N /2 e alla modalità x i che presenta la frequenza assoluta cumulata N i più piccola tale che: N i (N /2)+1 ; Nel caso con N pari si possono avere due valori mediani distinti.

27 Il calcolo della mediana Se, invece, si dispone della distribuzione di frequenza relativa si può operare nel seguente modo. Sia X un carattere e sia, ad esempio, la distribuzioni di frequenza relativa Allora la mediana corrisponde: alla modalità x i che presenta la frequenza relativa cumulata F i più piccola tale che: F i 0,5

28 Il calcolo della mediana Nel caso la variabile sia definita mediante una distribuzione per classi di valori è possibile definire la classe mediana, la classe cioè che contiene la mediana. Se vogliamo trovare la mediana dobbiamo procedere nel seguente modo.

29 Alcuni esempi Sia data la seguente distribuzione di famiglie residenti per numero di componenti nella regione Abruzzo al 25/10/1981: Famiglie residenti per n°di componenti nella regione Abruzzo nini fifi FiFi , ,240, ,200, ,230, ,110,94 6 e pi ù ,061, ,00

30 Alcuni esempi In base alla definizione la mediana coincide la modalità x i che presenta la frequenza relativa cumulata F i più piccola tale che: F i 0,5 Quindi la mediana è rappresentata dalla modalità x=3, cioè Me=3

31 Alcuni esempi Sia data la seguente popolazione di un comune suddivisa per classi di età: Popolazione residente di un comune per classi di età (x i-1 - x i )nini fifi FiFi fino a 5 anni650,065 5 – 14980,0980, – ,1250, – ,2680, – ,3500, – 74750,0750, e oltre190,0191,000 Totale10001

32 Alcuni esempi In base alla definizione la mediana coincide la modalità x i che presenta la frequenza relativa cumulata F i più piccola tale che: F i 0,5 Quindi la mediana è rappresentata dalla classe

33 I quantili I quantili sono quei valori che ripartiscono i dati, disposti in ordine crescente, in parti uguali e possono essere considerati delle generalizzazioni della mediana. Possiamo considerare, in particolare: I quartili che suddividono in 4 parti uguali la distribuzione. Il primo quartile è preceduto da 1/4 dei dati e così via;

34 I quantili I decili che suddividono in 10 parti uguali la distribuzione; I centili che suddividono in 100 parti uguali la distribuzione.

35 Alcuni esempi Consideriamo lo stesso esempio precedente. Sia data la seguente distribuzione di famiglie residenti per numero di componenti nella regione Abruzzo al 25/10/1981: Famiglie residenti per n°di componenti nella regione Abruzzo nini fifi FiFi , ,240, ,200, ,230, ,110,94 6 e più234550,061, ,00

36 Alcuni esempi Ad esempio, il primo quartile è la modalità x i che presenta la frequenza relativa cumulata F i più piccola tale che: F i 0,25 In questo caso il primo quartile è rappresentato dalla modalità x=2, cioè Q 1 =2 Ad esempio, il terzo quartile è la modalità x i che presenta la frequenza relativa cumulata F i più piccola tale che: F i 0,75 In questo caso il terzo quartile è rappresentato dalla modalità x=4, cioè Q 3 =4

37 Alcuni esempi Ad esempio, il primo decile è la modalità x i che presenta la frequenza relativa cumulata F i più piccola tale che: F i 0,10 In questo caso il primo decile è rappresentato dalla modalità x=1, cioè D 1 =1 Ad esempio, il terzo decile è la modalità x i che presenta la frequenza relativa cumulata F i più piccola tale che: F i 0,30 In questo caso il terzo decile è rappresentato dalla modalità x=2, cioè D 3 =2

38 Alcuni esempi Si fa notare che il secondo quartile Q 2 coincide con la mediana.

39 La moda La moda Mo di una popolazione, distribuita secondo un carattere X, è la modalità prevalente del carattere cioè la modalità alla quale è associata la massima frequenza.

40 La moda Se vi è una sola moda la distribuzione è detta unimodale, nel caso contrario plurimodale (bimodale, trimodale, ecc). Esempio: Consideriamo gli obiettivi di 137 fondi pensionistici classificati in 5 modalità xixi nini GI26 IL42 MC20 SC42 TK12 La distribuzione è bimodale

41 La moda Se la distribuzione è unitaria o di frequenze, allora è facile individuare la moda; se la variabile è definita per classi di valori allora è possibile definire la classe modale, cioè la classe che presenta la massima densità di frequenza.

42 Un esempio Sia data la seguente popolazione di un comune suddivisa per classi di età e si calcoli la classe modale: Popolazione residente di un comune per classi di età x i-1 - x i nini fino a 5 anni e oltre19 Totale1000

43 Un esempio La classe modale è la classe alla quale corrisponde la massima densità di frequenza Popolazione residente di un comune per classi di età x i-1 - x i nini hihi fino a 5 anni6513, , , , , ,36 75 e oltre191,27 Totale1000

44 Un esempio In questo caso la classe modale la classe Si fa notare che lampiezza dellultima classe è stata posta pari a 15.

45 Alcune riflessioni sulle medie OSSERVAZIONE La moda è una misura più stabile della media e della mediana (non si modifica quando si aggiungono dati anomali). In termini statistici si dice che la moda è robusta.

46 Alcune riflessioni sulle medie ESEMPIO: Se consideriamo la seguente distribuzione: 3, 4, 7, 2, 3, 1, 8, 12, 1, 3,5, 6, 9 Si ha che la moda è pari a 3. Non si modifica se aggiungiamo una osservazione uguale a 1000 (o 10000!!).

47 Alcune riflessioni sulle medie Con gli stessi dati, dopo aver ordinato le osservazioni, otteniamo che la mediana è 4. 1, 1, 2, 3, 3, 3, 4, 5, 6, 7, 8, 9, 12 Se aggiungiamo il valore 1000, le osservazioni sono così modificate: 1, 1, 2, 3, 3, 3, 4, 5, 6, 7, 8, 9, 12, 1000 Le mediane sono due, pari a 4 e 5.

48 Alcune riflessioni sulle medie Con gli stessi dati, otteniamo che la media è 4.92 Se aggiungiamo il valore 1000, la media diviene 76.

49 La variabilità Consideriamo le tre seguenti distribuzioni di voti presi da otto studenti allesame di statistica:

50 La variabilità La media aritmetica di tutte e tre le distribuzioni è sempre uguale ma le tre distribuzioni sono molto diverse tra loro. DEFINIZIONE: Si chiama variabilità (nel caso quantitativo) e mutabilità (nel caso qualitativo) lattitudine dei caratteri ad assumere modalità differenti.

51 La variabilità Una misura della variabilità dovrebbe avere queste tre caratteristiche: 1. Indicata con I V tale misura, si dovrebbe avere: 2. I V è nulla se e solo se tutti i termini della distribuzione sono uguali tra loro, pari a c, quindi cioè se il carattere risulta concentrato in una unica modalità;

52 La variabilità 3. I V cresce allaumentare della disuguaglianza fra i termini.

53 La variabilità Categorie di indici di variabilità 1. Indici che misurano la variabilità del carattere tramite una sintesi di misure di diversità tra ogni termine della distribuzione ed una media (SCOSTAMENTI MEDI); 2. Indici che misurano la variabilità misurando la diversità fra due particolari termini della distribuzione (INTERVALLI DI VARIAZIONE). Un indice di variabilità che è espresso nella stessa unità di misura del carattere è detto assoluto.

54 Gli scostamenti medi Sia la distribuzione del carattere X e sia la media aritmetica del carattere. Definiamo con i valori assoluti degli scarti dalla media aritmetica. Pertanto, è possibile definire lo scostamento quadratico medio dalla media aritmetica (standard deviation, definito da Pearson nel 1893) per distribuzione unitarie come:

55 Gli scostamenti medi Nel caso di distribuzioni di frequenze assolute si ha: Mentre nel caso di distribuzioni di frequenze relative si ha:

56 La varianza Il quadrato dello scostamento quadratico medio dalla media aritmetica rappresenta un famosissimo indice di variabilità denominato varianza: cioè la Var(X) è la media aritmetica dei quadrati degli scarti dalla media aritmetica. Nel caso di distribuzioni di frequenze assolute e relative si ha rispettivamente:

57 La varianza OSSERVAZIONI: La varianza è un indice assoluto ed è espresso nella stessa unità di misura (al quadrato) del fenomeno studiato; infatti gli scarti possono essere infinitamente lontani dalla media aritmetica.

58 Un esempio Si considerino le altezze in cm del seguente collettivo costituito da 5 persone (distribuzione unitaria) PersoneAltezza in cm

59 Un esempio i TOT88034

60 xixi nini Totale40 Un esempio Si considerino i voti riportati allesame di statistica da 40 studenti (distribuzione di frequenza).

61 xixi nini xinixini (x i - )(x i - ) 2 (x i - ) 2 n i Totale Per calcolare la varianza ci aiutiamo con la seguente tabella

62 La media aritmetica è pari a: Pertanto la varianza è uguale a:

63 Unaltra formula per il calcolo della varianza Nella pratica il calcolo della varianza si effettua molto spesso con la seguente formula:

64 Un esempio Riprendiamo i dati dellESEMPIO precedente, cioè i voti riportati allesame di statistica da 40 studenti: xixi nini Totale40

65 Un esempio Per il calcolo della varianza aiutiamoci con la seguente tabella Voti dell'esame di statistica xixi nini xi2xi2 xi2nixi2ni Totale

66 Un esempio La media aritmetica è sempre pari a: La varianza calcolata con questa formula alternativa è pari a:

67 La variabilità relativa Se devo eseguire confronti fra fenomeni espressi con diverse unità di misura o sullevoluzione di uno stesso fenomeno rilevato in due unità temporali o spaziali diverse non posso utilizzare la varianza per confrontare la variabilità delle due distribuzioni.

68 La variabilità relativa Esempio: peso di un gruppo di neonati ed uno di adulti Adulti Neonati Quale collettivo è più variabile?

69 Il coefficiente di variazione Un indice molto noto è il coefficiente di variazione, introdotto da K. Pearson nel E il rapporto tra la deviazione standard e la media

70 Il coefficiente di variazione adulti bambini CV è scale-free o numero puro (non dipende dallunità di misura adottata). Come tale è adatto ai confronti. Esempio: peso di un gruppo di neonati ed uno di adulti AdultiNeonati

71 Il coefficiente di variazione Senon è definito il CV, in quanto non è interpretabile una variabilità negativa, né dividere un numero per zero.

72 Intervalli di variazione Possiamo definire i seguenti indici che misurano la variabilità del carattere tra due particolari termini della distribuzione o fra due quantili: 1.Campo di variazione o range 2.Campo di variazione interquartile (terzo quartile – primo quartile)

73 La concentrazione La concentrazione può essere misurata se un carattere X è di tipo quantitativo trasferibile, cioè se è possibile trasferire, anche solamente in via teorica, lammontare del fenomeno da una unità statistica ad una altra, tendendo o meno alla situazione di equidistribuzione. E un aspetto rilevante della variabilità di un carattere quantitativo.

74 La concentrazione Esempio: La ricchezza di un paese è tanto più concentrata quanto minore è la frazione di ricchezza posseduta dalla parte più povera della popolazione. Si può parlare di concentrazione finanziaria, urbana, ecc. DEFINIZIONE: Un carattere trasferibile è equidistribuito fra le N unità del collettivo se lammontare complessivo A del carattere X è distribuito in parti uguali fra le N unità, cioè se ogni unità possiede la quantità A/N.

75 La concentrazione Se un carattere non è equidistribuito allora possiamo affermare che è concentrato. La situazione di concentrazione massima si ha quando una sola unità possiede tutto lammontare del carattere e tutte le altre unità statistiche non possiedono niente.

76 Indici di concentrazione Un indice di concentrazione deve essere pari a 0 nel caso di equidistribuzione (minima concentrazione) ed aumentare fino ad un massimo assunto nel caso di massima concentrazione. Consideriamo ora una popolazione di N elementi. Ordiniamo le N unità secondo la loro modalità, in ordine non decrescente, del carattere X.

77 Indici di concentrazione, dove per ragioni di semplicità espositiva si è tralasciata la notazione x (1) per indicare la prima modalità ordinata. Se è lammontare del carattere posseduto dalla i-esima unità ordinata, con allora si ha :

78 Indici di concentrazione Si definisca ora con: lammontare complessivo del carattere posseduto dalle i unità più povere con i=1,2,…,N. Si considerino ora le seguenti distribuzioni: 1.la distribuzione delle prime i unità, dove: della frazione cumulata rappresenta la la frazione delle i unità più povere alle quali spetta lammontare A i del carattere

79 Indici di concentrazione. 2.la distribuzione cumulata dellammontare del carattere, dove: della frazione rappresenta la frazione dellammontare complessivo (intensità) del carattere detenuto dalle prime i unità (le i unità più povere).

80 Indici di concentrazione Infatti, avendo ordinato i dati in senso non decrescente, il primo 10%, ad esempio, delle unità più povere detengono al più il 10% dellammontare totale del carattere; se così non fosse non sarebbero le i unità più povere. Si fa notare che con i, inoltre risulta sempre per ogni i=1,2,…,N: sono funzioni non decrescenti

81 Indici di concentrazione CASO DI MINIMA CONCENTRAZIONE (Equidistribuzione) Si ha quando: In questo caso risulta: per ogni i=1,2,…,N CASO DI MASSIMA CONCENTRAZIONE Si ha quando: In questo caso risulta:

82 Il rapporto di concentrazione CASI INTERMEDI Nei casi intermedi il carattere è tanto più concentrato quanto maggiore è la differenza Consideriamo quindi: la sommatoria precedente è estesa da 1 a N-1, in quanto: Lindice (1) è un indice assoluto di concentrazione. (1)

83 Il rapporto di concentrazione Il minimo dellindice si ha nel caso di equidistribuzione, cioè quando: Il massimo dellindice si ha quando vi è massima concentrazione cioè:

84 Il rapporto di concentrazione e allora: Pertanto, è possibile definire lindice relativo come: Tale indice è noto come rapporto di concentrazione del Gini.

85 Il rapporto di concentrazione OSSERVAZIONE: Il calcolo di R è relativo ai singoli valori non raggruppati in una distribuzione di frequenze e pertanto per una popolazione ampia può risultare gravoso calcolarne il valore.

86 Un esempio Si richiede di calcolare il rapporto di concentrazione del Gini. Velletri43 Frascati20 Marino31 Tre comuni del Lazio avevano al 21/12/1980 la seguente popolazione in migliaia di unità

87 Un esempio Prima ordiniamo i valori e poi calcoliamo F i e q i : ComunePopolazioneFiFi qiqi Frascati200,330,21 Marino310,670,54 Velletri4311 Totale94

88 Un esempio Quindi possiamo calcolare il rapporto di concentrazione R del Gini: ComunePopolazioneFiFi qiqi F i -q i Frascati200,330,210,12 Marino310,670,540,13 Velletri4311 Totale94 0,25

89 Un esempio Il risultato finale è pertanto pari a:

90 La curva di concentrazione Consideriamo ora la rappresentazione grafica dei punti (F i,q i ) per i=1,2,…,N. In un piano cartesiano, riportiamo in ascisse i valori F i e in ordinate i valori q i Nel caso di equidistribuzione si ha F i =q i e quindi i punti si dispongono sulla bisettrice del I quadrante. Il segmento che unisce i punti di coordinate (0,0) e (1,1) viene chiamato segmento di equidistribuzione.

91 La curva di concentrazione Se non vi è equidistribuzione i punti di coordinate (p i,q i ) si trovano nel triangolo di vertici (0,0), (1,0) e (1,1). Unendo tali punti si ottiene una linea chiamata spezzata di concentrazione o curva di Lorenz.

92 La curva di concentrazione (1,0) (0,0) FiFi F i+1 qNqN q i+1 qiqi (1,1) FNFN

93 La curva di concentrazione In generale, quanto è maggiore la concentrazione del carattere, tanto più la spezzata di concentrazione risulta vicina allasse dellascisse e quindi tanto è più grande larea della superficie compresa fra il segmento di equidistribuzione e la spezzata di concentrazione.


Scaricare ppt "Indici di tendenza centrale o di posizione Si può operare in due modi: Fornire dei valori intorno ai quali si ritiene sia concentrata la variabile dando."

Presentazioni simili


Annunci Google