Modelli di Microsimulazione Matteo Richiardi (Università Politecnica delle Marche and Collegio Carlo Alberto – LABOR) Corso per il personale della Direzione centrale preposta alla rilevazione, elaborazione e validazione dei dati statistici per il coordinamento statistico attuariale Collegio Carlo Alberto – LABORatorio R. Revelli 18 ottobre 2007
indice I modelli di previsione I modelli di microsimulazione Modelli di cella Modelli di coorte Modelli econometrici I modelli di microsimulazione Microsimulazione statica Microsimulazione dinamica Sviluppo storico Elementi base Stima e validazione
tassi di occupazione – 2 fotogrammi
tassi di occupazione – il film
tassi di occupazione – i processi sottostanti
Modelli di previsione modelli cell-based modelli di coorte modelli con tipi rappresentativi modelli microeconometrici modelli macroeconometrici modelli CGE modelli di microsimulazione approccio micro approccio macro
modelli cell-based estrapolazioni di medie di celle, tenendo conto di previsioni esterne (es. proiezioni demografiche) sulll’evoluzione della composizione delle diverse celle nella popolazione
modelli cell-based “constant” scenario i tassi di participazione per coorti quinquennali e genere rimangono constanti al livello del 2000
Un esempio – oss. 2004
Hp: oss. 2003-2004
Proiezione di trend (dati aggregati)
Proiezione di trend (dati aggregati)
Hp: tassi di entry ed exit costanti (micro dati)
Hp: tassi di entry ed exit costanti (micro dati)
Hp: tassi di entry ed exit costanti (micro dati)
Il vero processo con effetti di coorte
Il vero processo con effetti di coorte
morale della storia … … diffidare di chi promette di stimare effetti di coorte a partire da una base dati con scarsa componente longitudinale !!!
modelli macroeconometrici stima nei dati aggregati della domanda e dell’offerta, nonché dei ritardi di aggiustamento dell’equilibrio a seguito di shock esogeni / specifiche politiche
modelli microeconometrici stima del comportamento individuale, eventualmente condizionale a specifiche politiche, nei dati reali si considera generalmente un numero molto limitato di eventi
microsimulazione Simulazione dell’evoluzione delle storie (stati, comportamenti) di unità individuali (persone, famiglie, imprese …) in specifici contesti (di mercato, istituzionali …) Interesse di policy: analisi degli effetti aggregati e distributivi di politiche / scenari, per mezzo della simulazione della loro implementazione su di un campione rappresentativo di individui
evidence-based policy making L’evidenza è nei dati reali, viene manipolata dal modello di microsimulazione, produce altra evidenza nei dati artificiali
evidence-based policy making Quali sono le conseguenze di uno specifico scenario? Quali politiche possono essere attuate? Chi ci guadagnerà e chi ci perderà? Quanto costa implementare queste politiche? Quali incentivi / disincentivi creeranno? Come si modificheranno i comportamenti individuali?
applicazioni Sistema fiscale (tasse e trasferimenti) Pensioni Previsioni di bilancio Pianificazione urbana Gestione del traffico Gestione delle risorse naturali …
caratteristiche Analisi distributiva Possibilità di scelta ex-post del livello di analisi desiderato, purché la numerosità sia sufficiente Interazione di diversi livelli: micro (caratteristiche individuali) macro (evoluzione demografica, trend nel mk del lavoro …) istituzionale (leggi, norme, convenzioni …)
Microsimulazione statica l’obiettivo è ricostuire la distribuzione fY(Y|X,P) di una variabile endogena Y, condizionale alle variabili esogene X e ai parametri istituzionali P 2 soli periodi: popolazione iniziale e popolazione finale (“1st round effects”) no cambiamenti nei comportamenti, o nella composizione della popolazione es. tax & benefit: il modello contiene tutte le regole per il calcolo delle tasse e dei benefici e calcola il reddito disponibile di tutti gli individui nella popolazione iniziale
Microsimulazione statica modelli statici sono talvolta utilizzati per proiezioni di breve periodo in questo caso la popolazione iniziale viene fatta evolvere attraverso il cosiddetto static ageing, una riponderazione delle unità individuali per tenere conto del cambiamento nella composizione della popolazione, così come previsto da proiezioni esterne al modello se l’analisi viene svolta a differenti livelli (es. individui e famiglie) pesi diversi possono essere utilizzati (grossing)
EUROMOD microsimulazione statica tax-benefit multi-paese, che copre i 15 paesi UE pre-2004 (in corso di estensione) reddito disponibile = = A. stipendi e salari + B. redditi da lavoro autonomo + C. redditi da proprietà + D. altri redditi + E. pensioni + F. benefici monetari (assegni familiari, assistenza sociale…) – G. tasse e contributi sociali e previdenziali
EUROMOD
Microsimulazione dinamica 2 elementi dinamici: 1. (alcune) variabili X2 sono considerate endogene rispetto ad (alcune) politiche P2 fX,Y(Y,X2|X1,P) = fY|X(Y|X1,X2,P1) fX(X2|P2) es. cambiamenti nell’offerta di lavoro in risposta a cambiamenti nel sistema fiscale Le probabilità di transizione dipendono da variabili ritardate: X2 include Yt-j produce un panel di storie simulate
Microsimulazione dinamica Moduli più comuni: cambiamenti demografici (fertilità, migrazione…) formazione e dissoluzione di unità famigliari scelte di istruzione determinazione del livello di salute determinazione dello status occupazionale determinazione del reddito /reddito disponibile determinazione dei risparmi e della ricchezza scelte di pensionamento
storia Guy Orcutt (1957), “A new type of socio-economic system”: se esiste una relazione non lineare tra gli input (Xi) e gli output (Yi), il valore aggregato di Y dipende da tutta la distribuzione degli input, e non solo dal valore aggregato (o medio) di X “In microsimulation modeling there is no need to make assumptions about the average economic man. Although unpractical, we can in principle model every man.” (Klevmarken, 2001)
storia Anni ’70: sviluppo di modelli di microsimulazione (dinamica) su larga scala: DYNASIM (Orcutt) CORSIM (Caldwell) richiedevano però risorse troppo ingenti in termini di hw, sw, data, in particolare rispetto alla mancanza di microdati del tempo Anni ’80: ripiegamento su modelli (statici) più compatti: modelli contabili con poche o nulle retroazioni in termini di cambiamento nei comportamenti, che si concentrano sugli effetti di breve periodo, ceteris paribus, delle politiche
storia Anni ’90: “rinascita” dei modelli dinamici, causata dalla diminuzione dei costi di calcolo e dalla maggiore disponibilità di dati Esperienze di cooperazione e trasferimento di conoscenza: - EUROMOD, sviluppato da un consorzio di ricercatori di 15 paesi - “migrazione” di CORSIM in Canada e Svezia
diffusione
principi di fondo approccio micro analisi di equilibrio parziale stima microeconometrica dei diversi moduli che compongono la microsimulazione (dinamica) feedback assenti o limitati tra i diversi moduli
elementi base popolazione iniziale regole di transizione (contabili, di comportamento), deterministiche o probabilistiche popolazione simulata
dati necessari popolazione iniziale (cross-section) stima delle equazioni di comportamento non necessariamente coincidono, ma tutte le variabili utilizzate in 2. devono essere presenti in 1. se la specificazione dei modelli di comportamento prevede effetti di coorte, 1.e 2. non coincidono le stime possono essere effettuate su cross-section collezione di cross-section panel data
Probabilità di transizione quando sono stimate nei dati, possono essere utilizzate “grezze” (Montecarlo simulation) o “aggiustate” per allineare le distribuzioni risultanti a previsioni esterne (alignment). Quest’ultima procedura è equivalente a stimare dei differenziali della probabilità di transizione
Algoritmi per ogni periodo deve essere specificata la sequenza di applicazione delle diverse probabilità di transizione (ordine degli eventi) questo ordine determina la successione dell’esecuzione dei diversi moduli ciascun modulo può contemplare più eventi questi eventi possono essere diversi a seconda degli individui
Stima Modelli statici: niente da stimare Modelli dinamici: stima congiunta vs. separata dei diversi moduli. La stima separata è giustificata solo se vi è mancanza di correlazione tra i diversi moduli Calcolo degli intervalli di confidenza: la variabilità dipende da (i) estrazione dei numeri casuali, (ii) campionamento della popolazione iniziale, (iii) imprecisione delle stime Bootstrapping
Validazione In-sample: verifica del potere predittivo del modello nel descrivere i dati su cui è stato stimato Out-of-sample: i dati reali disponibili vengono partizionati in 2: una parte (es. 2/3 del periodo) viene utilizzata per la stima e la rimanente (es. 1/3 del periodo) viene riservata per il test dei risultati
grazie !