Analisi Statistica del Reddito e delle Condizioni di Vita Capitolo 3 Povertà a livello locale.

Slides:



Advertisements
Presentazioni simili
Trieste, 26 novembre © 2005 – Renato Lukač Using OSS in Slovenian High Schools doc. dr. Renato Lukač LinuxDay Trieste.
Advertisements

Brussels launch of the Association Bruno Trentin-ISF-IRES Fulvio Fammoni President Associazione Bruno Trentin-Isf-Ires (Italy) Brussels, 26 settembre 2013.
“FIBROSI NEFROGENICA SISTEMICA”
Centro Internazionale per gli Antiparassitari e la Prevenzione Sanitaria Azienda Ospedaliera Luigi Sacco - Milano WP4: Cumulative Assessment Group refinement.
I numeri, l’ora, I giorni della settimana
L’esperienza di un valutatore nell’ambito del VII FP Valter Sergo
Come analizzare i dati (principali test statistici impiegati)
Cache Memory Prof. G. Nicosia University of Catania
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Caduta non guidata di un corpo rettangolare in un serbatoio Velocità e rotazione.
1 12 aprile 2005 Approximate Dynamic Factor Models: sviluppi della teoria e applicazioni – parte prima Andrea Brasili Strategie e Studi – UniCredit Banca.
Teoria e Tecniche del Riconoscimento
TAV.1 Foto n.1 Foto n.2 SCALINATA DI ACCESSO ALL’EREMO DI SANTA CATERINA DEL SASSO DALLA CORTE DELLE CASCINE DEL QUIQUIO Foto n.3 Foto n.4.
1 Pregnana Milanese Assessorato alle Risorse Economiche Bilancio Preventivo P R O P O S T A.
Parametri Acustici (ISO 3382)
Interfacce Java.
1 Teaching Cloud Computing and Windows Azure in Academia Domenico Talia UNIVERSITA DELLA CALABRIA & ICAR-CNR Italy Faculty Days 2010.
La dinamica del moto browniano Cosa hanno in comune ubriachi, luce, virus e mercati finanziari ?
A. Oppio, S. Mattia, A. Pandolfi, M. Ghellere ERES Conference 2010 Università Commerciale Luigi Bocconi Milan, june 2010 A Multidimensional and Participatory.
Relaunching eLene Who are we now and which are our interests.
EBRCN General Meeting, Paris, 28-29/11/20021 WP4 Analysis of non-EBRCN databases and network services of interest to BRCs Current status Paolo Romano Questa.
DG Ricerca Ambientale e Sviluppo FIRMS' FUNDING SCHEMES AND ENVIRONMENTAL PURPOSES IN THE EU STRUCTURAL FUNDS (Monitoring of environmental firms funding.
Frontespizio Economia Monetaria Anno Accademico
Cancer Pain Management Guidelines
A. Nuzzo U.O. di Oncologia Medica ospedale Renzetti di Lanciano (CH)
HDM Information Design notation v.4. HDM Information Design.
Programmazione 1 9CFU – TANTE ore
TIPOLOGIA DELLE VARIABILI SPERIMENTALI: Variabili nominali Variabili quantali Variabili semi-quantitative Variabili quantitative.
Ufficio Studi UNIONCAMERE TOSCANA 1 Presentazione di Riccardo Perugi Ufficio Studi UNIONCAMERE TOSCANA Firenze, 19 dicembre 2000.
Ergo : what is the source of EU-English? Standard British English? Standard American English? Both!!!! See morphology (use of British.
1. Conoscere luso delle collezioni in Java Comprendere le principali caratteristiche nelle varie classi di Collection disponibili Saper individuare quali.
Metodi di simulazione numerica in Chimica Fisica Dario Bressanini Universita degli Studi dellInsubria III anno della Laurea triennale in Scienze Chimiche.
2000 Prentice Hall, Inc. All rights reserved. 1 Capitolo 3 - Functions Outline 3.1Introduction 3.2Program Components in C++ 3.3Math Library Functions 3.4Functions.
6.6Ordinamento di Vettori Ordinamento di dati –Applicazione computazionale importante –Virtualmente ogni organizzazione deve ordinare dei dati Enormi quantità
Magnetochimica AA Marco Ruzzi Marina Brustolon
Queuing or Waiting Line Models
2000 Prentice Hall, Inc. All rights reserved. 1 Capitolo 6: Classi e astrazione dati 1.Introduzione 2.Definizione delle strutture 3.Accedere ai membri.
WP 10 – Applicazioni Astrofisica – stato Leopoldo Benacchio INAF Osservatorio Astronomico di Padova Pisa maggio 03.
VARO SRL LOGISTIC, QUALITY, SERVICE
National Project – on going results Potenza 7/10 November 06 IT-G2-SIC-066 – Social Enterprise and Local Development.
Compito desame del Svolgimento della Sezione 5: CONTROLLORI Esempio preparato da Michele MICCIO.
FUNZIONI DI GRUPPO Le funzioni di gruppo operano su un set di record restituendo un risultato per il gruppo. AVG ([DISTINCT|ALL] n) media, ignora i valori.
LHCf Status Report Measurement of Photons and Neutral Pions in the Very Forward Region of LHC Oscar Adriani INFN Sezione di Firenze - Dipartimento di Fisica.
Palermo, may 2010 F.Doumaz, S.Vinci (INGV-CNT- Gruppo di telerilevamento)
PASTIS CNRSM, Brindisi – Italy Area Materiali e Processi per lAgroindustria Università degli Studi di Foggia, Italy Istituto di Produzioni e Preparazioni.
Ischia, giugno 2006Riunione Annuale GE 2006 Exploiting the Body Effect to Improve Analog CMOS Circuit Performances *P. Monsurrò, **S. Pennisi, *G.
Gli ambienti di apprendimento Firenze, 3 marzo 2006.
1 Negozi Nuove idee realizzate per. 2 Negozi 3 4.
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
Motor Sizing.
My Italian Experience By Ryan Davidson. My daily routine in Urbino If there was no field trip in the morning, my daily routine in Urbino was very basic.
Bando Arti Sceniche. Per poter procedere è indispensabile aprire il testo del Bando 2ROL - Richieste On Line.
CORE STRENGTH SYNERGY AND ITS INFLUENCE IN NON CHRONIC LBP Anna Rita Calavalle, Davide Sisti, Giuseppe Andolina, Marco Gervasi, Carla Spineto, Marco Rocchi,
embryo GPS dish (Rieger et al., 2007) Avvicinamento degli embrioni rispetto a micro gocce tradizionali e minore superficie.
Calibrating (Partial Equilibrium) Mathematical Programming Spatial Models Open questions … (filippo arfini) III Workshop PUE&PIEC - Treia (Mc), 3-4 febbraio.
24 aprile 2002 Avvisi: Risultati 1 o Esonero: (entro) lunedi 27 disponibili nella pag. WEB, ma anche esposti nella bacheca fuori dal corridoio 2 o dente,
21 marzo 2002 (ri-)Avvisi: Giovedi 28 marzo la lezione e sospesa. Nuovo indirizzo di Spedire messaggi e esercizi solo.
UG40 Energy Saving & Twin Cool units Functioning and Adjustment
Collection & Generics in Java
EMPOWERMENT OF VULNERABLE PEOPLE An integrated project.
A PEACEFUL BRIDGE BETWEEN THE CULTURES TROUGH OLYMPICS OLYMPIC CREED: the most significant thing in the olympic games is not to win but to take part OLYMPIC.
Lezione n°27 Università degli Studi Roma Tre – Dipartimento di Ingegneria Corso di Teoria e Progetto di Ponti – A/A Dott. Ing. Fabrizio Paolacci.
Italian 1 -- Capitolo 2 -- Strutture
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8 Analisi Fattoriale: Scelta del numero di fattori e loro interpretazione.
Scenario e Prospettive della Planetologia Italiana
Castelpietra G., Bassi G., Frattura L.
1 Acceleratori e Reattori Nucleari Saverio Altieri Dipartimento di Fisica Università degli Studi - Pavia
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
Povertà a livello locale
The effects of leverage in financial markets Zhu Chenge, An Kenan, Yang Guang, Huang Jiping. Department of Physics, Fudan University, Shanghai, ,
Transcript della presentazione:

Analisi Statistica del Reddito e delle Condizioni di Vita Capitolo 3 Povertà a livello locale

2 Concetti introduttivi - Modelli con effetti casuali di area - Poverty mapping - Metodo Empirica Best per la stima di misure di povertà tradizionali e Fuzzy per piccole aree* -Applicazioni e sviluppi * Questo paragrafo costituisce un approfondimento.

3 Concetti introduttivi - 1 La stima per piccole aree rappresenta uno strumento molto utile quando si deve misurare la povertà e la disuguaglianza a livello regionale, ma i dati campionari sono disponibili solo a livello nazionale. In questo caso sono necessarie tecniche statistiche e metodologie economiche per utilizzare informazioni ausiliarie. Il termine piccola area può essere riferito (Rao, 2003) sia ad aree geografiche di piccole dimensioni, sia a domini formati da sub- popolazioni definite sulla base di particolari caratteristiche demografiche o sociali.

4 Concetti introduttivi - 2 In letteratura sono classificati come modelli per piccole aree quei modelli che utilizzano informazioni ausiliarie disponibili a livello di piccola area e a livello di singola unità campionaria (nucleo familiare o individuo). Esiste una vasta gamma di tecniche di stima per piccole aree, e si tratta di un ambito di ricerca in continua espansione. Ladattabilità e lefficienza di una tecnica rispetto ad unaltra, varia a seconda della specificità delle situazioni e della natura dei dati a disposizione.

5 Concetti introduttivi - 3 I metodi di stima per piccole aree possono essere classificati secondo il tipo di inferenza in tre gruppi: i) metodi basati sul disegno (o campionari); ii) metodi assistiti da modello; iii) metodi basati sul modello (approccio predittivo).

6 Concetti introduttivi - 4 Per i metodi del gruppo (i) il parametro di interesse viene stimato utilizzando i procedimenti campionari classici basati sulla distribuzione di probabilità indotta dal disegno di campionamento. Con questo metodo il parametro è pensato come una costante e gli stimatori sono corretti rispetto al disegno di campionamento applicato. La loro variabilità però, cresce al diminuire della numerosità del campione e può accadere che nessuna unità campionaria sia presente nella piccola area, impedendo così di ottenere una stima del parametro di interesse di piccola area. Questa classe è composta solo da metodi diretti, e ne fanno parte gli stimatori classici, tra i quali il più utilizzato è quello di Horvitz e Thompson.

7 Concetti introduttivi - 5 Per i metodi del gruppo (ii) linferenza è basata sul disegno e sul modello. Lobiettivo è quello di ottenere stimatori corretti indipendentemente dalla scelta del modello, sfruttando le informazioni derivanti dal disegno campionario. Questa classe è formata dallo stimatore diretto di regressione e da molti altri indiretti, tra i quali gli stimatori sintetici e quelli combinati.

8 Concetti introduttivi - 6 Per i metodi del gruppo (iii) laspetto rilevante è costituito dal fatto che il parametro oggetto di studio non è pensato come una costante, ma come una variabile casuale. Appartengono a questa categoria i modelli di piccola area (Small Area Models). Questi modelli prevedono la presenza di effetti casuali di area (Area Level Random Effects Model, Fay e Herriot, 1979), che vengono utilizzati quando linformazione ausiliaria è disponibile solo a livello di area.

9 Modelli con effetti casuali di area - 1 Come già anticipato, questi modelli possono essere utilizzati quando linformazione ausiliaria esiste allo stesso livello di disaggregazione territoriale per il quale devono essere calcolati gli indici di povertà e disuguaglianza. Questi modelli collegano i parametri di interesse alle variabili ausiliarie a livello di piccole aree, considerando gli effetti casuali indipendenti. Il modello base include gli effetti casuali specifici di ogni area. Il vettore di p variabili ausiliarie a livello di piccola area è: (5.1)

10 Modelli con effetti casuali di area - 2 I parametri di interesse θi (totali, medie, proporzioni, eccetera) possono essere così indicati: (5.2) dove i=1,…,m, zi sono costanti positive note, β è il parametro di regressione del vettore px1, m sono le piccole aree e vi sono variabili casuali indipendenti e identicamente distribuite con media 0 e varianza σv2.

11 Modelli con effetti casuali di area - 3 Inoltre si ipotizza che gli stimatori diretti siano disponibili per le piccole aree, non distorti dal disegno, e che sia valido il seguente modello: (5.3) dove ei sono gli errori campionari nellarea i, indipendenti, con media 0 e varianza ψi, questo significa che si tratta di stimatori corretti rispetto al disegno.

12 Modelli con effetti casuali di area - 4 Combinando le equazioni (5.2) e (5.3) riportate sopra, si ottiene il seguente modello lineare ad effetti misti di Fay e Herriot (1979): (5.4) Esso considera gli effetti casuali di area vi, gli errori di campionamento ei ed assume la loro indipendenza. Questo è un caso particolare del modello lineare misto con una struttura della covarianza diagonale, così come la maggior parte dei modelli di stima per piccole aree suggeriti in letteratura.

13 Stimatore BLUP e EBLUP Utilizzando i risultati generali del modello lineare ad effetti fissi e casuali si può determinare il predittore ottimo lineare e corretto, BLUP (Best Linear Unbiased Predictor) per il modello di stima per piccole aree a livello di area per θi: (5.5) dal quale si deduce che esso è una media ponderata dello stimatore diretto e dello stimatore sintetico di regressione, dove è lo stimatore BLUE (Best Linear Unbiased Estimator) di β.

14 Poverty mapping - 1 Questa metodologia, facente parte delle metodologie di stima per piccole aree, combina le informazioni censuarie e quelle campionarie per produrre delle mappe disaggregate a livello territoriale. Queste mappe sono necessarie per descrivere la distribuzione spaziale della povertà e della disuguaglianza in un paese; non si tratta però esclusivamente di mappe, ma di database ad alta disaggregazione.

15 Poverty mapping - 2 La procedura è più impegnativa rispetto al metodo EBLUP per quanto riguarda i dati che sono necessari (dati censuari a livello micro), benché non sia richiesto un abbinamento tra i dati censuari e campionari a livello di micro disaggregazioni. Lidea di base è quella di stimare un modello di regressione lineare con le componenti della varianza a livello locale (small area), utilizzando le informazioni provenienti dai campioni più piccoli, le informazioni aggregate dei censimenti, e dove possibile, integrarle con altre fonti.

16 Poverty mapping - 3 La variabile dipendente del modello di regressione è costituita dal reddito disponibile familiare o dal consumo. La stima della distribuzione di queste variabili può essere utilizzata per generare la distribuzione in ogni sottopopolazione censuaria, condizionata alle caratteristiche osservate nella sottopopolazione stessa. Dalla stima della distribuzione di una variabile monetaria nei dati censuari, o in ogni sottopopolazione, può essere fatta una stima delle misure di povertà o di ineguaglianza. Per valutare la precisione delle stime è necessario che gli errori standard di queste misure siano calcolati utilizzando le procedure appropriate che vedremo successivamente.

17 BASIC IDEA To estimate a linear regression model with local variance components on the LSMS data (the dependent variable is a monetary variable) – ESTIMATION (Stage 1) The distribution of the dependent variable is used to generate the distribution for any subpopulation in the Census conditional to the observed data – IMPUTATION or SIMULATION (Stage 2) Poverty mapping - 4

18 Stage 1: Estimation The model: it is a linear approximation to the conditional distribution of the logarithm consumption expenditure of household h in cluster c, The error component is specified to allow for a within cluster correlation in disturbances. IMPORTANT: six different models have been estimated. Poverty mapping - 5

19 Stage 2: Simulation The estimates obtained are applied to the Census data to simulate the expenditure for each household in the Census. 100 simulation has been conducted The simulated values are: The beta coefficients, are drawn from a multivariate normal distribution with mean and variance covariance matrix equal to the one associated to. Poverty mapping - 6

20 For the residual, any specific distributional form assumption has been avoided so the residual are drawn directly from the estimated residuals. For each of the simulated consumption expenditure distributions a set of poverty and inequality measures has been calculated. Mean over all the simulations point estimates Standard deviation over all the simulations bootstrapping standard error. Poverty mapping - 7

21 Caso di Studio: Albania POVERTY AND INEQUALITY MEASURES The procedure for estimating the poverty and inequality measures has been applied for the whole of Albania and disaggregated at seven levels: a) Rural – urban level; b) The four strata used in sampling the LSMS; c) The six strata for which the linear regression models have been estimated; d) The 12 Prefectures; e) The 36 Districts; f) The 374 Communes/Municipalities; g) The 11 Mini-municipalities in which the city of Tirana is divided.

22

23 THE MAPS Maps 1,2: Very spatial heterogeneity among Prefectures Maps 3,4: Low heterogeneity among Districts within the Prefecture to which they belong Maps 5,6: Heterogeneity among Municipalities within the same District

24 Analysis of the relationship between inequality in the whole Country and inequality within and between its regions Maps 7,8: 2/3 of the Prefecture have HCR and C significantly different from the National level. Maps 9,10: less than 20% of the District have HCR and C significantly different from the Prefecture they belong Maps 11,12: more than 40% of the Municipality have HCR and C significantly different from the District to which they belong

25 Figure 1. Head Count Ratio Figure 2. Per Capita Consumption by Prefectures.

26 Figure 3. Head Count Ratio Figure 4. Per Capita Consumption by District.

27 Figure 5. Head Count Ratio Figure 6. Per Capita Consumption by Municipality.

28 Figure 7. Prefectures Level Head Count Ratio versus Albania Head Count Ratio Figure 8. Prefecture Level Per Capita Consumption versus Albania Per Capita Consumption

29 Figure 9. District Level Head Count Ratio versus Prefecture Level Head Count Ratio Figure 10. District Level Per Capita Consumption versus Prefecture Level Per Capita Consumption

30 Figure 11. Commune Level Head Count Ratio versus District Level Head Count Ratio Figure 12. Commune Level Per Capita Consumption versus District Level Per Capita Consumption

31 Consideriamo un vettore casuale y contenente i valori di una variabile casuale per le unità di una popolazione finita tale che dove ys è il sub- vettore degli elementi campionati e yr il sub-vettore degli elementi non campionati. Lobiettivo è predire il valore di una funzione misurabile reale del vettore casuale y usando i dati campionati ys. Il miglior stimatore (BP) di delta è la funzione di ys che minimizza lerrore quadratico medio dello stimatore. Formalmente: (3.1) * Questo paragrafo consiste in un approfondimento Empirical Best* - 1

32 Generalmente, dipende da un vettore di parametri non noti theta che può essere sostituito con un opportuno stimatore, ottenendo così un BP empirico di (EB). E interessante notare che, quando y segue una distribuzione Normale con vettore medio per una matrice nota X, matrice di covarianza positiva V, e la quantità da predire è una funzione lineare di y, allora lo stimatore EB è uguale allo stimatore BLUP visto nella lezione di Lunedì 12 Aprile. Empirical Best - 2

33 Case Study: Small Area Estimation of poverty and inequality measures: EBLUP and R software Gianni Betti SSCU – Kiev, Ukraine 8 April 2010

34 Scope of the presentation Introduce the problem Small area estimation techniques The BLUP and EBLUP EBLUP at Oblast level in Ukraine Codes in R software

35 Why small area estimators ? Sample household surveys as EU-SILC, ECHP and HBS are traditionally designed for performing estimates at National level. In certain cases, when the sample size is particularly large, the estimates may also be significant at (large) regional level. However, often the sub-samples are large enough for large regions, but not sufficient for smaller regions.

36 Example of yesterday: Gini coefficent at Oblast level: how large are the standard errors ?

37 Why small area estimators ? We have taken into account a simpler statistic: Head Count Ratio: HCR=FGT(0) Monetary variable: Total equivalent consumption expenditure Equivalence scale: Academy of Science

38 Results of direct estimates and standard errors

39 So: small area estimators Fundamental aspects of our approach Making the best use of survey data (precise standard errors) Aggregated information from diverse sources (as administrative registers or other surveys) Using them in combination – small area estimation

40 Choice of the Region - 1 Oblast level could be the first administrative level of disaggregation It could be necessary to go further, i.e. to estimate measures at a smaller level So: how to choose the unit which serves as a region ?

41 Choice of the Region - 2 Basic choices: Geographical units based on or defined according to some functional criteria. Example: Labour Market Regions - useful for specific policy purposes; less suited for general use, and for comparisons across regions of the Europe (EU and non EU countries) Units defined in terms of the urban-rural classification (more elaborate than a simple urban-rural dichotomy) - but no agreed criteria as to the definition of Urban-Rural Units based on administrative/political criteria, specifically NUTS regions Most suited, but must be supplemented by analysis using - other types of units - also by (non-geographical) population subgroups

42 Choice of the Region - 3 In the European Union the NUTS classification has been officially chosen by Eurostat The Nomenclature of Territorial Units for Statistics (NUTS) was established by Eurostat more than 30 years ago in order to provide a single uniform breakdown of territorial units for the production of regional statistics for the European Union.

43 Choice of the Region Most commonly used for social policy (e.g., National Action Plans/incl) 2.Comparability facilitated by a common framework 3.Exhaustive and non-overlapping coverage of the population 4.Hierarchical structure provides framework for integration of the information across levels 5.Communication: this type of units already widely understood, accepted, and used 6.Data availability – e.g. Eurostat Free Dissemination Database (NewCronos) Links with information from many other sources based on NUTS classification

44 Application to the HCR=FGT(0)

45 Performance measures Table 2 below shows some performance measures of the SAE Model, where three interesting measures are shown: the model parameter gamma (γ). It is the ratio between the model variance and the total variance, and is the share of the weight given to the direct survey estimate in the final composite estimate; the ratio between the EBLUP estimated value and the corresponding direct estimate. This is to check the extent to which the modelling changes the input direct estimates; the ratio between mean square error (MSE) of the EBLUP estimate of the Oblast, and the MSE of direct survey estimate (which in this case is simply the variance, since the estimates are unbiased). This is to check the extent to which the modelling has improved precision of the estimates.

46 Application to the HCR=FGT(0)

47 Comment to the results For what it concerns the weights given to direct estimate (gamma), those are lower for those Oblasts with lower sub-sample sizes. In these cases, the gain in terms of MSE can reach 20% for Oblasts like Zhytomyrska, Sumska and Ternopilska. Moreover, the direct estimates for the City of Sevastopil (2,70%), is considered a too value by any expert in poverty analysis. The final estimate (4,81%) should be a much more unbiased value. Here, the gain in terms of MSE is not large, since the reduction in the original standard error, is compensated by the increase of the real MSE, which is obviously proportional to the magnitude of the estimated measure.

48 Future research Define a smaller disaggregation level compared to Oblast level; Estimate poverty and inequality (direct) measures at that level; Estimate standard errors with Jackknife Repeated Replications (or BRR); Identify variables to be used as regressors in the EBLUP model available for that disaggregation; Perform EBLUP estimates; Evaluate the gain in terms of variance (greater compared to Oblast level).