La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

LEZIONE A.11 La concentrazione TQuArs – a.a. 2010/11 Tecniche quantitative per lanalisi nella ricerca sociale Giuseppe A. Micheli.

Presentazioni simili


Presentazione sul tema: "LEZIONE A.11 La concentrazione TQuArs – a.a. 2010/11 Tecniche quantitative per lanalisi nella ricerca sociale Giuseppe A. Micheli."— Transcript della presentazione:

1 LEZIONE A.11 La concentrazione TQuArs – a.a. 2010/11 Tecniche quantitative per lanalisi nella ricerca sociale Giuseppe A. Micheli

2 In questa lezione.. concentrazione In questa lezione facciamo la conoscenza con lultimo, diffuso, concetto utilizzato per descrivere la variabilità di un carattere: la concentrazione. Approderemo allo stesso concetto per due strade assai differenti: media delle differenze Da una parte formuleremo un nuovo criterio di misura della variabilità non come dispersione intorno a un polo centrale, ma come media delle differenze tra tutte le osservazioni prese a due a due. Di questa misura: rapida di calcolo Impareremo una procedura rapida di calcolo. normalizzazione Effettueremo la normalizzazione di questa misura. grafico Introdurremo poi un nuovo tipo di grafico, che collega proporzioni via via cumulate di una popolazione con le corrispondenti proporzioni dellintensità totale del carattere da esse possedute. In particolare: proprietà Esamineremo le proprietà di questa curva ben nota in Economia. esempi Svolgeremo degli esempi, alcuni semplici altri più articolati. dominanza Infine introdurremo il concetto di dominanza tra due curve.

3 La differenza media Un diverso modo per studiare la "diversità di valori osservati" consiste nel considerare gli informatori elementari [distanze] d ij =|x i –x j | i,j. indici di mutua variabilità Si possono costruire indici di mutua variabilità, considerando una qualche funzione D(x) di sintesi di una v.s. X che soddisfi le proprietà canoniche (mai ne- gativa, pari a zero SSE x i =x j i,j, dotata delle proprietà di invarianza rispetto alle traslazioni e monotonicità). Come per la funzione di perdita, sintetizziamo le distanze in una media ponderata. Differenza me- dia semplice senza ripetizione: In particolare definiamo Differenza me- dia semplice senza ripetizione: procedura rapida di calcolo Il calcolo di, come si può immaginare, è lungo e macchinoso, richiedendo di conteggiare le differenze tra tutte le modalità osservate a due a due. Ma per v.s. discrete esiste, ed è equivalente, una procedura rapida di calcolo. Indicate con q i =x in i le già note inten- sità specifiche e definite (per analogia alle cumulate N i ) Q i = k=1..i q k le corri- spondenti intensità cumulate, la diffe- renza media semplice è pari a:

4 Un esempio allosso xixi nini NiNi q i =x in i QiQi N=10T=40 q iN i Q i n i A=368B=176 Lesempio è stupido, come è stupida la procedura di calcolo. Si tratta di conteggiare le due colonne aggiuntive delle q iN i e delle Q in i, senza pretendere che abbiano alcun significato! A questo punto il calcolo di richiede solo i tre parametri cerchiati

5 Rapporto di concentrazione di Gini distribuzione massimante di X E possibile normalizzare, è cioè possibile trovarne un massimo? La risposta è la stessa data per la varianza. La differenza media cresce con lordine di grandezza del fenomeno studiato, ma per una particolare categoria di caratteri, che abbiamo definito trasferibili, si può trovare un massimo a parità di intensità totale T, che è quello della distribuzione massimante di X: Per questa distribuzione la differenza media semplice senza ripetizione è: Si può perciò definire un normalizzato: R si chiama rapporto di concentrazione di Gini.

6 Eterogeneità dispersione concentrazione Confrontiamo i concetti di eterogeneità, dispersione e concentrazione. I tre concetti sembrano avere consistenti punti di sovrapposizione; ma per coglierne le differenze la cosa migliore è confrontare le situazioni definite come di minimo e (nel caso di caratteri trasferibili) di massimo: mutabilità (o eterogeneità) nulla coincide con quella di concentrazione nulla e con quella di dispersione nulla. La situazione di mutabilità (o eterogeneità) nulla (un unica modalità osservata N volte) coincide con quella di concentrazione nulla e con quella di dispersione nulla. distribuzione di massima eterogeneità La distribuzione di massima eterogeneità (tante modalità equi- frequenti) è invece per definizione diversa dalla distribuzione massimante [massima concentrazione o massima varianza per caratteri trasferibili]. La differenza è lampante! Max eterogeneità:Max concentrazione e dispersione:

7 Confrontare frequenze e intensità cumulate intensità cumulata Nel calcolo rapido di abbiamo introdotto, accanto al concetto di frequenza cumulata, quello di intensità cumulata. Come per la prima, possiamo definire un'intensità cumulata relativa: Il confronto tra le due successioni F i e S i, per ogni modalità i, è di uso comune e prezioso per valutare la mutua variabilità (o la concentrazione) di un carattere trasferibile in una popolazione.

8 Il senso del confronto il 90 % della po- polazione possiede solo il 5 % delle risorse Quando diciamo che in certi paesi del Sud del Mondo "il 90 % della po- polazione possiede solo il 5 % delle risorse" facciamo riferimento ad una variabile X = risorse disponibili che ha, per esempio, una distribuzione così fatta (numerosità espressa in milioni): xixi nini NiNi FiFi qiqi QiQi SiSi 190 0,9090 0, , , Dunque la concentrazione di un carattere trasferibile è un modo alternativo ma molto evocativo per descrivere la mutua variabilità di un feno- meno. come rappresentarla graficamente come misurarla sinteticamente Ci poniamo allora due domande sulla Concentrazione:

9 Dieci monete e cinque persone Dieci monete siano divise non equamente tra 5 individui:X = {1,1,1,2,5}. Ognuno dei 5 individui costituisce il 20 % della popolazione. Posti (per convenzione) in ordine crescente di carattere posseduto, il primo individuo (20 % della popolazione) possiede solo il 10 % del carattere, lultimo il 50% dellintero capitale. C'è quindi una certa concentrazione del carattere. Viceversa nella seriazione Y={2,2,2,2,2} a ogni 20 % della popolazione spetta la stessa quota (20 %) del carattere. Formalizziamo i due casi in termini di frequenze e intensità cumulate. xixi nini NiNi FiFi qiqi QiQi SiSi 1110,2110,1 1120,4120,2 1130,6130,3 2140,8250, yiyi nini NiNi FiFi qiqi QiQi SiSi 2110, , ,6260,5 2140,

10 La curva di Lorenz-Gini La curva di Lorenz–Gini è la spez- zata, posta nel primo quadrante, ottenuta congiungendo i punti di coordinate (F i,S i ) [frequenze cu- mulate relative e intensità cumu- late relative], inscritta nel quadra- to compreso tra O (0,0) e P (1,1). La curva può essere costruita con dati disaggregati (serie) o aggregati. Per es. la v.s. X delle 10 monete è rappresentabile anche così: xixi nini NiNi FiFi qiqi QiQi SiSi 1330,6330,3 2140,8250, FiFi SiSi

11 Proprietà della curva di Lorenz-Gini / 1 La spezzata giace sempre nella parte inferiore del dominio (F i,S i ): quella cioè sottostante alla bisettrice del quadrante che corrisponde al caso di concentrazione nulla o equiripartizione (F i = S i per ogni i). Ciò significa che ogni punto della spezzata (tranne il primo e l'ultimo) ha ordinata inferiore allascissa e ciò per costruzione, in quanto le modalità x i sono disposte in ordine crescente. Come per frequenze e frequenze cumulate, anche nella rappresentazione grafica della concentrazione possiamo sostituire le coordinate assolute (N i, Q i ) a quelle relative (F i, S i ), mantenendo inalterate le proporzioni interne. Solamente, il massimo delle coordinate sarà P (N, T) invece che (1, 1). QiQi NiNi

12 Proprietà della curva di Lorenz-Gini / 2 la spezzata ha concavità sempre rivolta verso l'alto, cioè i segmenti hanno pendenza sempre crescente. Inoltre la spezzata ha concavità sempre rivolta verso l'alto, cioè i segmenti hanno pendenza sempre crescente. La pendenza di una retta è data dal rap- porto tra i due cateti del triangolo ret- tangolo (è la tangente dellangolo). Ma: Poiché per costruzione le modalità sono messe in ordine crescente, tg i–1

13 Misurare la concentrazione con Lorenz-Gini Il grado di concentrazione di una v.s. è tanto più alto quanto più la concavità della spezzata si allon- tana dalla bisettrice e si avvicina alla forma limite della distri- buzione massimante, Il grado di concentrazione di una v.s. è tanto più alto quanto più la concavità della spezzata si allon- tana dalla bisettrice e si avvicina alla forma limite della distri- buzione massimante, corrisponden- te alla spezzata OCP, dove C=(N–1;0) Si può allora definire geometricamente una misura di concentrazione come rapporto tra l'area (A) com- presa tra la bisettrice [situazione di equiripartizione] e la spezzata (area a tratteggio verticale) e l'area A max compresa tra la bisettrice e la spezzata di massima concentrazione (a tratteggio orizzontale). Perfetta equiripartizione Max con- cen- tra- zione

14 Il rapporto di concentrazione di Gini Si può dimostrare che R è proprio equivalente alla differenza media senza ripetizioni normalizzata Ci sono molte procedure per calcolare R. Ma una di queste usa misure a noi già familiari. Si può dimostrare che R è proprio equivalente alla differenza media senza ripetizioni normalizzata. Per il calcolo di R dunque la procedura rapida di calcolo di, già vista, è la più conveniente. Rapporto di Concentrazione di Gini. Il rapporto tra le 2 aree è un indice standardizzato e si chiama Rapporto di Concentrazione di Gini. Vediamo qualche esempio.

15 Un primo esempio xixi nini qiqi NiNi QiQi qiNiqiNi QiniQini FiFi SiSi ,110, ,220, , ,440, ,550, ,670, ,780, ,890, =2(A-B)/(N.(N-1))= =54808/(9.8)=761,22 max =2(T/N)=23758/9= =2639,78 R = / max = 0,288 Concentrazione degli in- troiti pubblicitari (milioni di euro) tra nove emit- tenti radiofoniche. (in questo caso le nu- merosità specifiche sono tutte unitarie) Ricordatevi: il grafico si costruisce individuando i punti blu, e collegandoli poi tra loro P(0.55,0.37)

16 Un secondo esempio xixi nini q i =x i n i NiNi QiQi qiNiqiNi QiniQini Distribu- zione dei redditi familiari in Lom- bardia m=43,52 FiFi SiSi 0,1150,026 0,5140,301 0,8290,663 0,9410,844 0,9750,914 0,9950, Questa area è il 28,65% dellintera a- rea triangolare sottesa alla bisettrice

17 Distribuzione gaussiana e curva di Lorenz xixi nini q i =x i n i NiNi FiFi QiQi SiSi ,006600, , , , , , , , , , , Distribuzione redditi N(70; 20,7) La distribuzione osservata dei redditi è skew. Ma qual è la concentrazione (e la curva di Lorenz) se, a parità di intensità totale, la distribuzione è gaussiana? Blu distr.gaussiana Rosso osservata In questo caso i dati distribuiti secondo una N(m,) mostrano minore concentrazione (curva di Lorenz più vicina alla bisettrice). Ma non cè una regola. Simmetria e concentrazione di una v.s. sono due proprietà distinte: ognuna va per la sua strada.

18 Distribuzione uniforme e curva di Lorenz xixi nini q i =x i n i NiNi FiFi QiQi SiSi , , , , , , , , , , , , Blu distrib.uniforme Rosso osservata Distribuzione uniforme (m=70) Ecco subito una riprova. A parità di intensità totale, una distribuzione uniforme (più dispersa della N) mostra concentrazione maggiore di quella osservata. Ma attenzione. La distribuzione skew osservata ha curva di Lorenz più vicina alla bisettrice per le cumu- late basse della popolazione (i poveri) ma poi interse- ca quella della distribuzione uniforme, e per i più ric- chi (coda a destra della curva) essa rivela più spere- quazione. Per capir meglio ci vuole un terzo esempio.

19 Un terzo esempio X i (000) n i (000) q i ante (10M) FiFi S i ante T=tax (10M) q i post (10M) %T/ q i post S i post % % % % % % % % % % A sinistra: distribu- zione dei redditi tra i titolari di codice fi- scale in UK, m=7,52; R=0,397 (molto superiore a quella Lombarda!) A destra: redistribu- zione dei redditi do- po tassazione pro- gressiva. m=6,34; R=0,352 Osserviamo su dati reali (Economic Trends del Central Statistical Office) leffetto di una tassazione sui redditi. A parità di proporzione di popolazione, la proporzione di reddito è sempre superiore, cioè più vicina alla bisettrice che esprime la situazione di perfetta equiripartizione.

20 Trasferimenti equiparativi e concetrativi Rosso = prima dellimposta Blu = dopo limposta Proporzione di popolazione Proporzione di redditi Essendo calcolata su caratteri trasfe- ribili la misura di concentrazione è sensibile a trasferimenti "paretiani": trasferimenti equiparativi: tolgo- no unità di conto a qualche individuo attribuendole ad altri che possiedono una quota del carattere totale pari o inferiore a quella posseduta dall individuo depauperato (per es. una imposta progressiva che si traduce in servizi per i meno abbienti) (più di rado) trasferimenti con- centrativi (per es. fissare per il buo- no-scuola una soglia minima rimbor- sabile di euro e nel frat- tempo derubricare i falsi in bilancio). La manovra inglese del 1984 è un e- sempio di trasferimento equiparativo.

21 Dominanza secondo Lorenz Eccoci tornati, in conclusione, allo strano caso di due curve di Lorenz (redditi osservati e redditi con distribuzione uniforme) intersecate tra loro. Non è un caso eccezionale! Lorenz-dominante Date due curve di Lorenz A e B, diciamo che A è Lorenz-dominante rispetto a B se la curva di A più vicina alla bisettrice in ogni punto, cioè: S i A > S i B F i Ovvio che una curva dominante su unaltra corrisponde a una situazione di maggiore perequazione, quindi Se S i A >S i B F i R A S i B F i R A < R B Le due curve inglesi sono un buon esempio. Ma possiamo pensare a situazioni meno nette, in cui le scelte si rivelano più complesse. Per esempio…

22 Equità e polarizzazione.. Supponiamo che la distribuzione dei redditi nella società A, per effetto di una certa politica, assuma la forma B, con lo stesso ammontare complessivo di risorse (per es. stesso Pil), ma una diversa configurazione. xiAxiA niAniA qiqi NiNi QiQi qiNiqiNi QiniQini FiFi SiSi ,200, ,720, ,880, ,960, xiBxiB niBniB qiqi NiNi QiQi qiNiqiNi QiniQini FiFi SiSi , ,950, A =2( )/(100.99)= =3,03 max A =2(400/100)=8 R A = / max = 0,379 B =2( )/(100.99)= =2,83 max B =2(400/100)=8 R B = / max = 0,354 R B = 0,354 < 0,379 = R A La società in B è più perequata La società in B è più perequata.. Eppure sembra più polarizzata che mai! Cosa si può dire in più confrontando le due curve di Lorenz?

23 Se due curve di Lorenz si intersecano Rosso = società B Blu = società A Le politiche attuate hanno prodotto in B una scomparsa dei ceti medio- alti (X=8) e un addensamento della maggior parte della popolazione (75 su 100) su valori medio bassi. In compenso il restante 25% è po- larizzato tra un 20% di nullatenenti e un 5% di benestanti. R di Gini suggerisce sinteticamente unaccresciuta perequazione: ma non agli estremi della scala sociale. E meglio allora una società (B) con un ceto medio omogeneo ma con forti sperequazioni verso il basso, o una società (A) più perequata là dove ci sono meno risorse? R di Gini sintetizza una situazione. Ma se vogliamo interpretarla in funzione di diversi obiettivi alternativi, meglio leggere il grafico!


Scaricare ppt "LEZIONE A.11 La concentrazione TQuArs – a.a. 2010/11 Tecniche quantitative per lanalisi nella ricerca sociale Giuseppe A. Micheli."

Presentazioni simili


Annunci Google