La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Appunti sulla concentrazione a.a. 2013-2014

Presentazioni simili


Presentazione sul tema: "Appunti sulla concentrazione a.a. 2013-2014"— Transcript della presentazione:

1 Appunti sulla concentrazione a.a

2 2 Indice Che cos’è la concentrazione? La curva di concentrazione di Lorenz L’indice di concentrazione di Gini Confrontare la concentrazione di due caratteri Riferimenti

3 3 Che cos’è la concentrazione “There may be wide difference of opinion as to the significance of a very unequal distribution of wealth, but there can be no doubt as to the importance of knowing whether the present distribution is becoming more or less unequal.” C. Lorenz

4 4 Che cos’è la concentrazione Intuitivamente un carattere statistico (si pensi ad esempio al reddito) è tanto più concentrato quanto più risulta suddiviso tra poche unità della popolazione. Ogni situazione reale sarà intermedia tra due situazioni estreme che chiameremo di concentrazione massima e di equiripartizione. Si ha massima concentrazione quando una sola unità statistica possiede la totalità del carattere. Si parla invece di equiripartizione quando tutte le unità della popolazione possiedono la stessa quantità di carattere. Per lo studio della concentrazione sono utili: -La curva di concentrazione di Lorenz -L’indice di concentrazione di Gini

5 5 Che cos’è la concentrazione La concentrazione può essere studiata per caratteri trasferibili, ovvero caratteri quantitativi che, almeno in linea di principio, possono essere trasferiti tra le unità considerate. Es: l’età non è un carattere trasferibile (tra gli individui) e non lo è neppure l’intensità delle precipitazioni (tra le località considerate). Es: il reddito e il patrimonio sono carattere trasferibili (tra gli individui). Il numero di azioni di una certa azienda è trasferibile (ad esempio tra gli azionisti). I finanziamenti ricevuti dalle regioni italiane sono trasferibili (ad esempio tra le regioni o altri enti dello stato).

6 6 Curva di concentrazione Consideriamo una popolazione di N individui e ordiniamo le quantità del carattere (intensità) possedute dalle unità statistiche in senso non decrescente: 0 ≤ x 1 … ≤ x N. Definiamo, per i=1…N :

7 7 Curva di concentrazione Vale sempre (F N,Q N ) = (1,1) quindi la curva congiunge l’origine degli assi con il punto (1,1). La curva è convessa essendo Q i ≤ F i per ogni i. Quest’ultima diseguaglianza segue dal fatto che: Poniamo (F 0,Q 0 )=(0,0). Definiamo curva di Lorenz la spezzata che si ottiene congiungendo le coppie (F i,Q i ) sul piano cartesiano. Il generico punto (F i,Q i ) si può interpretare in questo modo: l’ F i per cento più povero della popolazione possiede il Q i per cento del carattere totale.

8 8 Curva di concentrazione La curva di concentrazione è sempre compresa, potendo eventualmente coincidere, tra le due curve seguenti: La bisettrice di equazione Q=F. Lungo la bisettrice F i =Q i per ogni i, da cui segue che ogni unità possiede una quantità di carattere pari alla media dello stesso nella popolazione. La bisettrice rappresenta quindi la situazione di equiripartizione. La curva passante per i punti (F i,0), i=1,…,N-1. In tal caso tutto il carattere è concentrato in una sola unità statistica (l’N-esima) e la curva rappresenta quindi la situazione di massima concentrazione.

9 Esempio: curva di Lorenz 9 Dati i redditi di 7 individui: per ricavare la curva di concentrazione organizziamo le osservazioni in tabella, (avendo cura di ordinarle in base ai valori di x; ad esempio X 1 =16 perché l’individuo più povero possiede 16), calcoliamo le coordinate dei punti (F i,Q i ) e le congiungiamo. Nel caso in esame la curva è più vicina alla bisettrice. ix_iF_iQ_i

10 10 Indice di concentrazione di Gini Intuitivamente, quanto più la bisettrice si discosta dalla curva di concentrazione tanto maggiore è la concentrazione del carattere. E’ naturale quindi costruire un indice di concentrazione basato sullo “scostamento” della curva dalla bisettrice. Come misura dello scostamento si può utilizzare: la distanza verticale tra la curva di concentrazione e la bisettrice l’area compresa tra la curva di concentrazione e la bisettrice Come vedremo le due misure danno luogo allo stesso indice…

11 11 Calcolo dell’indice di Gini - 1 Definiamo indice di concentrazione di Gini il rapporto tra la somma delle distanze verticali tra la curva di concentrazione e la bisettrice e il valore massimo di tale somma: R = 0 nel caso di equiripartizione (ovvero quando F i - Q i = ?) R = 1 nel caso di massima concentrazione (ovvero quando un solo individuo possiede tutto il carattere: F i - Q i = F i, i=1,2,…,N-1)

12 12 Area di concentrazione Si definisce area di concentrazione l’area compresa tra la curva di concentrazione e la retta di equidistribuzione. Area del trapezio: ½ x Somma delle basi x altezza A Nella figura è indicata con A. E’ pari all’area del triangolo di coordinate (0,0) (1,0) (1,1) meno l’area dai trapezi di altezza F i -F i-1 e base Q i e Q i-1

13 13 L’indice di Gini si può calcolare anche dividendo l’area di concentrazione per il suo valore massimo: R=0 nel caso di equiripartizione (A =?) R=1 nel caso di massima concentrazione (A=A max ). L’area di concentrazione è massima quando un solo individuo, l’N-esimo, possiede tutto il carattere: x 1 =…= x N-1 =0, x N =Nμ e quindi A max =(N-1)/2N. Calcolo dell’indice di Gini - 2

14 14 L’indice Ř è pari a due volte l’area di concentrazione. Si ha Ř < R (perché?) con i due indici che tendono a coincidere per N grande. Calcolo dell’indice di Gini - 3 L’are di concentrazione non può superare il valore 0.5. Si può quindi ottenre un’approssimazione (che indichiamo con Ř) dell’indice di Gini dividendo l’area di concentrazione per 0.5:

15 15 Esempio: indice di Gini ix_iF_iQ_i (F i -Q i ) Totale Dati i redditi di 7 individui: per ricavare l’indice di concentrazione organizziamo le osservazioni in tabella, avendo cura di ordinarle in base ai valori di x, (ad esempio X 1 =16 perché l’individuo più povero possiede 16 e così via…) Utilizzando la formula (1) abbiamo:

16 16 Per calcolare R con la formula (2) usiamo una tabella simile alla precedente per ricavare il numeratore. L’area massima che compare a denominatore è pari all’area massima teorica meno l’area del triangolo di base F 7 -F 6 e a altezza 1. Il calcolo di Ř è del tutto analogo: è sufficiente porre il denominatore pari ½. Data i redditi di 7 individui: Esempio: indice di Gini (continua) ix_iF_iQ_i (F i -F i-1 )(Q i +Q i-1 ) Totale0.6658

17 17 Come calcolare l’indice per variabili statistiche discrete Finora abbiamo considerato N osservazioni non raggruppate. Per ricavare l’indice o la curva di concentrazione a partire da una distribuzione di frequenza possiamo usare le seguenti versioni “ponderate” di F i e Q i : dove x 1,…,x k sono k valori distinti ordinati in modo non decrescente con numerosità n 1,…,n k.

18 18 Unendo le coppie (F i *,Q i * ) si ottiene la stessa curva di concentrazione che si otterrebbe utilizzando i dati non raggruppati (infatti si può dimostrare che la pendenza della curva non cambia passando tra individui che hanno lo stesso ammontare di carattere. L’unica differenza è che ora per ottenere la spezzata si devono congiungere k

19 19 Nota: Nel caso in cui si disponga dell’informazione sull’ammontare totale di carattere in un intervallo si possono discretizzare gli intervalli in modo “coerente” con tale informazione. Esempio: se nell’intervallo [5,15) di numerosità N i =10 il carattere totale è pari a 60 è preferibile discretizzare l’intervallo assumendo come punto “medio” il valore 6 e non il valore 10 (al quale corrisponderebbe un reddito totale di 100 e non di 60). Si noti che devono essere note le numerosità degli intervalli per poter procedere in questo modo. Se si desidera ricavare la curva di concentrazione e l’indice di Gini per una variabile continua per intervallo, il modo più semplice di procedere consiste nel “discretizzare” la variabile considerando le frequenze “concentrate” nei punti medi degli intervalli. Si può poi procedere come nel caso di v.s discreta. Come calcolare l’indice per variabili continue per intervallo

20 20 Se X è una variabile statistica continua non negativa con densità f(x) e media finita μ le espressioni delle frequenze e delle intensità cumulate sono: Come calcolare l’indice per variabili statistiche continue

21 21 Solitamente nel caso continuo si esprime Q direttamente in funzione della frequenza cumulata r. Ponendo F(x) = r si ottengono le due nuove variabili: Come calcolare l’indice per variabili statistiche continue dove Q(r) è interpretabile per ogni r in [0,1] come la proporzione di carattere posseduta dal 100r % più povero della popolazione.

22 Nel caso continuo l’area di concentrazione massima è pari ad ½ e quindi il l’indice di Gini è: R = A/A max = 2A =1-2B. Come calcolare l’indice per variabili statistiche continue Per ricavare R si può adattare la formula (3) già vista nel caso discreto:

23 23 E’ possibile associare ad ogni curva di Lorenz un numero aleatorio (Farris, 2010). Per farlo riscriviamo la (5) usando i quantili: Dalla prima uguaglianza è detta share density perché esprime la quota di carattere posseduta dalle unità che cadono tra i quantili r j-1 ed r j. Dalla seconda uguaglianza si ricava s(r) =d/dr[Q(r)]. Essendo s(r) > 0 e ∫ s(r)dr=Q(1)=1 la share density è una funzione di densità di probabilità. Quale esperimento genera un numero casuale con densità s(r)? Ad esempio il seguente: si estrae un euro a caso del reddito totale e gli si associa il percentile R di reddito dell’unità a cui appartiene. Allora R ha densità di probabilità s(r). La share density

24 Confronti Può essere interessante confrontare la concentrazione di due caratteri oppure dello stesso carattere ma in due istanti diversi o in due ambiti territoriali diversi. Esempio 1: il reddito è più concentrato in Italia o in Francia? Esempio 2: la concentrazione del reddito in Italia è maggiore adesso oppure era più alta 10 anni fa? Un modo intuitivo per stabilire quale carattere è maggiormente concentrato è quello di confrontare graficamente le curve di concentrazione nei due ambiti territoriali (o temporali) e stabilire quale si trova al di sopra. 24

25 Non è detto che una delle due curve sia al di sopra dell’altra: le curve si possono intersecare. Si può tuttavia mostrare che se il carattere varia linearmente tra gli ambiti considerati allora le curve non si intersecano. Si può sempre effettuare il confronto usando l’indice di Gini. Poiché G=2A=1-2*Area_sotto_la_curva_Lorenz il confronto attraverso l’indice di Gini equivale al confronto tra le aree al di sotto delle curve di Lorenz dei due caratteri. Occorre quindi una certa cautela prima di confrontare, ad esempio, la concentrazione del reddito in due paesi con l’indice di Gini: infatti le aree al di sotto della curva possono essere le stesse anche in presenza di distribuzioni del carattere completamente diverse ! (Atkinson) Confronti

26 La concentrazione del reddito nel mondo usando l’indice di Gini. 26 Fonte: CIA, The world Factbook 2009 (dati )

27 27 Esempio di Confronto Tra Distribuzioni Si riportano di seguito le distribuzioni dei finanziamenti concessi da un istituto bancario per l’acquisto della prima casa a giovani coppie residenti in Campania ed in Sardegna: a)In quale regione risulta più elevata la concentrazione dei finanziamenti concessi? b)Confrontare graficamente i diversi livelli di concentrazione dei finanziamenti nelle due regioni

28 28 Concentrazione dei finanziamenti in Sardegna

29 29 Concentrazione dei finanziamenti in Campania

30 30 La concentrazione è più elevata in Sardegna La curva di Lorenz conferma questo risultato

31 31 Finora abbiamo assunto di avere a disposizione i dati relativi all’intera popolazione di N unità. Supponiamo di voler fare inferenza sulla curva e sull’indice di concentrazione della popolazione utilizzando un campione di n unità. Una stima della curva di concentrazione si ottiene rappresentando graficamente le coppie (Fi,Qi) campionarie come nel caso discreto. Dalla curva si può ricavare facilmente una stima dell’indice di Gini usando le formule (1) o (2). Il valore così ricavato è però una sottostima di R perché l’area di concentrazione della curva stimata è minore o uguale a quella effettiva. Inferenza

32 32 Uno stimatore non distorto dell’indice di Gini si può ricavare sfruttando la relazione: R=Δ/2μ dove: Δ = differenza media semplice tra le osservazioni μ = media delle osservazioni che possono essere stimate rispettivamente con: Δ^ = 1/[n(n-1)] Σ i Σ j |x i -x j | x^ = 1/n Σ i x i Inferenza

33 33 1)I redditi dei top 10 giocatori NBA (il campionato di basket professionistico americano) nell’anno 2014 sono stati i seguenti (in milioni di $ ): Disegnate la curva di concentrazione e interpretate il punto (F3,Q3). Calcolate l’indice di Gini usando la formula (1) e commentate il risultato ottenuto. 2) Un piccolo aereo da turismo ha effettuato otto voli trasportando questo numero di passeggeri: 12, 26, 13, 31, 34, 34, 17, 17. La concentrazione dei passeggeri è bassa o alta? Redistribuire i passeggeri tra i voli (lasciando invariato il totale) in modo che l’indice di Gini sia pari ad uno. 3) La curva di concentrazione del reddito del paese A ha equazione Q(r) = r 2. Quale proporzione di abitanti possiede il 30% del reddito totale? Ricavare il valore dell’indice di Gini e la share function s( r). Come si può interpretare s (0.5) ? 5) Nell’esercizio 1 i risultati cambierebbero se gli stipendi fossero espressi in euro? Spiegare intuitivamente e mostrare che l’indice di Gini è invariante a cambi dell’unità di misura. Esercizi

34 34 Per approfondire C. Gini (1912) Variabilità e mutabilità. Contributo allo studio delle distribuzioni e relazioni statistiche, Studi economici-giuridici dela Regia Università di Cagliari, anno III. Lorenz, M. O. (1905). Methods of measuring the concentration of wealth. Publications of the American Statistical Association, Vol. 9, No. 70) 9 (70): 209–219. Atkinson A.B. (1970). On the Measurement of Inequality, Journal of Economic Theory, 2, Farris F.A. (2010) The Gini Index and Measures of Inequality, The American Mathematical Monthly, 117.


Scaricare ppt "Appunti sulla concentrazione a.a. 2013-2014"

Presentazioni simili


Annunci Google