La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Indice di concentrazione di Gini Data una variabile y misurata su N individui Si ordinano i dati in ordine crescente Si considera la quota di Y detenuta.

Presentazioni simili


Presentazione sul tema: "Indice di concentrazione di Gini Data una variabile y misurata su N individui Si ordinano i dati in ordine crescente Si considera la quota di Y detenuta."— Transcript della presentazione:

1 Indice di concentrazione di Gini Data una variabile y misurata su N individui Si ordinano i dati in ordine crescente Si considera la quota di Y detenuta dai primi i individui (i=1,2,…N) E la quota di individui con y y i Definiamo le seguenti quantità: p i = frazione di A fino alla classe i q i = frazione di unità fino alla classe i Indice di concentrazione di Gini Compreso tra 0 e 1

2 Spiegazione grafica: Curva di Lorentz Se rappresentiamo le coppie p i ; q i in un grafico cartesiano e le congiungiamo otteniamo una spezzata che prende il nome di curva di concentrazione (o curva di Lorenz-Gini). Esempio: I redditi di 7 individui sono: 80, 90, 21, 23, 16, 32, 62. Dopo aver ordinato i redditi si ottengono le coppie di punti: p i ; q i In questo modoIn questo modo E questo grafico:

3 3 Curva di concentrazione Osservazioni: (p 0,q 0 )=(0,0) e (p N,q N )=(1,1) q i p i Dimostrazione

4 Il generico punto (p i,q i ) della curva si può interpretare nel seguente modo: Il (p i ·100)% più povero possiede il (q i · 100)% del reddito totale. La curva parte sempre da (0,0) e termina sempre in (1,1). Inoltre, essendo q i p i, la curva giace sempre al di sotto della retta passante per questi due punti (bisettrice). La curva è sempre comprese tra le due seguenti (potendo eventualmente coincidere): 1.La curva che giace sulla bisettrice. Essa è tale per cui p i =q i per ogni i da cui segue che ogni unità possiede una quantità di carattere pari alla media del carattere. Rappresenta quindi la situazione di equiripartizione. 2.La curva passante per i punti (F i,0) i=1,…,N-1 ed (1,1). Essa corrisponde alla situazione in cui tutto il carattere è concentrato in una sola unità statistica (lN-esima) e rappresenta quindi la situazione di massima concentrazione.

5 Intuitivamente, quanto più la bisettrice si discosta dalla curva di concentrazione tanto più aumenta la concentrazione del carattere. E naturale quindi costruire indici di concentrazione basati sullo scostamento della curva dalla bisettrice. Ad esempio si potrebbero usare: Le distanze verticali tra la curva di concentrazione e la bisettrice; Larea compresa tra la curva di concentrazione e la bisettrice. In ambedue i casi arriviamo allindice di concentrazione di Gini.

6 Le distanze verticali tra la curva di concentrazione e la bisettrice sono date da p i – q i Si noti come p i -q i 0 per ogni i Sommando le differenze e dividendo per il valore Massimo che tali differenze possono assumere ( tuuti i qi sono nulli tranne lultimo) otteniamo una formulazione dellindice di concentrazione di Gini R vale 0 nel caso di equi-ripartizione (p i - q i =0 per ogni i) R vale 1 nel caso di massima concentrazione p i - q i = p i i (p i - q n )= (p i )

7 In alternativa misuriamo larea tra la curva di concentrazione e la retta di equidistribuzione prende il nome di area di concentrazione. Si noti come larea di concentrazione sia sempre maggiore o uguale a zero. In particolare: nel caso di equiripartizione è pari a zero; al crescere della concentrazione cresce senza mai superare il valore 1/2.

8 Una misura esatta dellarea A di concentrazione può essere ottenuta sottraendo allarea del triangolo la somma delle aree degli n trapezi delimitati dai punti (F i,Q i ) per i =0,1,…,n. Area del trapezio: ½ x Somma delle basi x altezza A altezzaSomma basi

9 9 Un indice di concentrazione si può ottenere dividendo larea di concentrazione per il valore assunto da tale area nel caso di concentrazione massima: Dove si ottiene considerando x 1 =…= x N-1 =0 e x N =Nμ e risulta pari a (N-1)/2N. Si può dimostrare che il rapporto così costruito è uguale allindice definito in precedenza ovvero lindice di concentrazione di Gini si può ricavare anche dividendo larea di concentrazione per il suo valore massimo.

10 Il Fattore (N-1)/N Tende molto rapidamente ad 1 al crescere di N, quindi per N grande larea di concentrazione sarà data dalla differenza tra larea del triangolo sotteso alla bisettrice pari a 1/2 e la somma delle aree dei singoli trapezi senza normalizzazione otteniamo lindice di concentrazione di Gini in altra formulazione: Per N=25 la differenza tra gli indici è del 4% e per N=50 è del 2% Vedi esempio Excell

11 Vi sono molti modi per calcolare lindice di Gini: Ad esempio riprendiamo la definizione di una misura di variabilità (poco usata) DIFFERENZA MEDIA ASSOLUTA (CON RIPETIZIONE): Questa misura può essere interpretata come la differenza attesa tra i redditi di due individui selezionati in modo casuale dalla popolazione. E immediato dimostrare che in caso di equidistribuzione = 0 E in casi di massima concentrazione = 2

12 Rapportando al suo massimo ottengo un indice di concentrazione che è proprio lindice G di Gini Questa formulazione calcolatoriamente più complicata, si presta però ad una SCOMPOSIZIONE IMPORTANTE DELLINDICE Tra una componente entro e una tra in modo simile alla scomposizione della Varianza. Come vedremo

13 Prima (usuale) scomposizione Sia data una popolazione di N unità distinte in K gruppi su cui è misurata una variabile trasferibile Y (es. reddito) con media. Lindice G sarà: Definiamo due nuovi indici: 1.Lindice di Gini ENTRO il gruppo j-esimo di numerosità n j e media µ j Derivato dalle differenze tra gli appartenenti al gruppo j-esimo 2.Lindice di Gini TRA il gruppo j-esimo e h-esimo : Derivato dalle differenze di tutti gli appartenenti al gruppo J e tutti gli apparteneti al gruppo h

14 Scomposizione (proposta Dagum) Ovviamente lindice G (generale) sarà una media ponderata degli indici IN e TRA Definiamo i seguenti pesi: = quota della popolazione del gruppo j = quota di reddito della popolazione del gruppo j Allora lindice G può essere scomposto in:

15 Questa scomposizione ha, tuttavia, un problema molto rilevante: Normalmente i gruppi in cui viene suddivisa la popolazione, dal punto di vista dello ammontare del reddito hanno aree di sovrapposizione: Ad esempio vi saranno alcuni pensionati che percepiscono un reddito superiore a quello di alcuni lavoratori dipendenti, PUR ESSENDO IL REDDITO MEDIO DEI LAVORATORI DIPENDENTI SUPERIORE A QUELLO DEI PENSIONATI Come è noto, questo fenomeno va sotto il nome di TRANSVARIAZIONE Il problema nasce dl fatto che essendo la differenza media calcolata in base ai valori assoluti, essa è adirezionale cioè da lo stesso peso alla differenza di reddito dipendente maggiore di un reddito di pensione e viceversa. Un pensionato che guadagna 2000 euro contro un dipendente che ne percepisce 1000 Contribuisce alla misura della differenza TRA come un dipendente che guadagna 2000 e un pensionato che percepisce 1000 E evidente che il primo caso dovrebbe abbassare lindice, mentre il secondo dovrebbe incrementarlo

16

17 Dagum propone una una ulteriore e diversa scomposizione dellindice per tener conto della transvariazione. Seguiamo la sua proposta riprendendo il problema dallinizio:

18 Sia data una popolazione Q di n percettori con reddito y i con media partizionata in K gruppi essendo il gruppo j caratterizzato da numerosità n j e media j (j=1…..K). Si supponga che i gruppi siano ordinati in ordine crescente di valor medio Siano Le quote di popolazione e di reddito di ciascun gruppo Definiamo: Differenza media tra i gruppi j e h, generalizzazione della differenza media di Gini Indice di Gini della differenza TRA i gruppi j e k Naturalmente sarà:

19 Definiamo la relazione più ricca di (more affluent than) Un gruppo j sarà più ricco di un gruppo k se j > k Definiamo una misura di gross affluence tra due gruppi j e k Media delle differenze tra i redditi dei soggetti j che hanno un reddito superiore ai soggetti k E una misura della transvariazione tra i gruppi j e k (attenzione agli indici!) Media delle differenze tra i redditi dei soggetti k che hanno un reddito superiore ai soggetti j

20 Dato che le due misure scompongono le differenze in valore assoluto, è agevole dimostrare che dato j > k sia ha: Inoltre se non vi è sovrapposizione tra i redditi dei gruppi (transvariazione=0) e se j = k

21 Possiamo adesso definire la net affluence cioè la misura della maggiore ricchezza del gruppo j rispetto a lgruppo h AL NETTO DELLA TRANSVARIAZIONE come differenza tra le due componenti: E sarà: Infine, definiamo la Relative Net Affluence (REA) come il rapporto tra la net affluence e il suo massimo:

22 Questa misura: 1.È adimensionale (sia i p che i i d sono differenze di reddito e quindi il loro rapporto è un puro numero 2.Può essere definita come una misura di distanza economica direzionale In sostanza REA misura la proporzione di G jh (indice di Gini tra j e h) con cui le sottopopolazioni j e h contribuiscono alla disuguaglianza tra i gruppi, opportunamente ponderata per le numerosità e lammontare dei redditi (1-REA) misura la proporzione di G jh dovuta alla transvariazione tra i gruppi, che ovviamente nella valutazione della concentrazione TRA i gruppi, costituisce un fattore di disturbo, o meglio una componente da isolare. Opportunamente ponderati, i prodotti (G jh D jh ) e [G jh (1-D jh )] consentono di scomporre lindice generale di Gini in 3 componenti: Conc. TOT = Conc. IN + Conc. TRA (NETTA) + Conc. Da TRANSVARIAZIONE

23 Dove:

24 La scomposizione chiarisce il meccanismo che determina la diseguaglianza: Consideriamo come sempio i gruppi Lavoratori Dipendenti e Lavoratori autonomi e supponiamo che il reddito medio dei dipendenti sia maggiore di quello degli autonomi Gw = Concentrazione ENTRO i gruppi, quota di concentrazione dovuta alla disuguaglianza interna a ciascun gruppo, cioè la parte di diseguaglianza legata DISTINTAMENTE alla differenza tra i redditi dei lavoratori dipendenti e i redditi dei lavoratori autonomi. Gnb = Concentrazione TRA NETTA (al netto della trans-variazione). E la parte dovuta alla differenza tra i redditi dei dipendenti e i redditi degli autonomi per i quali il redditi dei dipendenti è MAGGIORE. Gt = TRANSVARIAZIONE E la parte dovuta alla differenza tra i redditi dei dipendenti e i redditi degli autonomi per i quali il redditi dei dipendenti è MINORE.

25 Semplificando (troppo) con uno slogan potremmo dire: In generale i dipendenti sono più ricchi degli autonomi Gw = Misura la differenza ricchi-poveri dentro ciascuna categoria, indipendentemente dalla tendenza generale, cioè allinterno dei dipendenti e allinterno degli autonomi Gnb = misura la differenza ricchi-poveri tra coloro che rispettano la tendenza generale (le medie) cioè tra i dipendenti ricchi e gli autonomi poveri Gt = misura la differenza ricchi-poveri tra coloro che invertono la tendenza generale (quella delle medie) cioè tra autonomi ricchi e dipendenti poveri

26 Nel caso di diversi gruppi il calcolo è complesso ma Per calcolare le diverse componenti della scomposizione proposta da Dagum è disponibile una macro di Excell messa a punto da S. Mussard, F. Seyte e M. Terraza nel Il programma può essere scaricato gratuitamente al seguente indirizzo: Cè anche a disposizione un codice SAS e R.


Scaricare ppt "Indice di concentrazione di Gini Data una variabile y misurata su N individui Si ordinano i dati in ordine crescente Si considera la quota di Y detenuta."

Presentazioni simili


Annunci Google