Una “soluzione d’angolo” y1y1 y2y2 0 B Di solito la scelta del consumatore è identificata dal punto di tangenza tra retta del bilancio e curva di indifferenza. Ma non sempre. Nella figura, la tangenza sarebbe nel punto B, in cui y 2 < 0. Ma un consumo negativo è impossibile. Il paniere preferito sulla retta del bilancio è A, Una corner solution A in cui y 2 = 0.
Il modello di Regressione Ricordando che: TRONCAMENTO : E(x/x>a) = + (a) e V(x/x>a) = ²[1- (a)] CENSURA:
ATTENZIONE notazione importantissima: Finora abbiamo considerato distribuzioni con un punto di troncamento a che viene poi standardizzato sottraendo la media e dividendo per Quando consideriamo i modelli di regressione 1.Il punto di troncamento rimane unico 2.Lo scarto rimane unico Ma…. 1.Il valor medio cambia, infatti sappiamo che E(y i ) = x i cioè è diverso per ciascun soggetto QUINDI il punto (UNICO) di troncamento ha un valore standardizzato DIVERSO per ciascun individuo e quindi avremo:
Regressione troncata: Regressione censurata: modello modello Tobin o Tobit (censura al punto 0) Quindi OLS distorti e inconsistenti
Regressione troncata: verosimiglianza Regressione censurata: verosimiglianza
Regressione troncata: effetto marginale: Il fattore 1- (che deriva dalla varianza troncata) è compreso tra 0 e 1 quindi per ciascuna variabile l’effetto marginale è MINORE del corrispondente coefficiente, si verifica una sorta di ATTENUAZIONE dell’effetto Questo avviene nella sottopopolazione NON troncata, naturalmente a volte siamo interessati a tutta la popolazione e quindi guarderemo semplicemente al coefficiente β che rappresenta l’effetto marginale nell’intera popolazione
Un risultato utile: abbiamo visto che Questo implica che: distorsione La varianza contiene le x (incluse nei i) quindi è ETEROSCHEDASTICO
Alcune domande fondamentali: Quale variabile è di interesse (cosa vogliamoprevedere)? –y*? (I non censurati) Probabilmente NO – di solito non rilevante –y? (la distribuzione latente) Di solito SI, il valore per una unità scelta a caso dalla popolazione –y | y>0? Forse. Dipende da ciò che ci interessa Qual’è il residuo? –(y – previsto)? Probabilmente no, come consideriamo gli zeri? –(qualcosa - x ) ? Probabilmente no. x Non è la media. Quindi quali sono gli effetti marginali e le medie condizionate alle x?
Regressione censurata: effetto marginale con censura a sx nel punto 0 Che può essere scomposta in due parti: Si vede così che un cambiamento nelle x ha un DOPPIO effetto: 1.Condiziona la media della parte NON censurata 2.Modifica la prob. di essere censurati
In altri termini l’effetto marginale non è costante, quindi la lettura dei coefficienti del modello NON è sufficiente. L’effetto sulle Y di una variazione delle X DIPENDE dal valore delle X, quindi, ad esempio, è diversa per ogni individuo (perché ha un vettore di X diverso) Se vogliamo una indicazione di sintesi rappresentiamo l’effetto delle X nel “punto medio” o per “l’individuo medio”. Cioè sostituiamo nelle formule di calcolo Se il modello ha più esplicativedue possibilità: 1.valutazione effettuata nel punto medio per UN coefficiente, e per un valore pari a 0 per le altre variabili 2.Valutazione nei punti medi di tutte le variabili, questo ultimo processo equivale a calcolare la media dei valori stimati individuali, modificando una sola variabile indipendente Con lo stesso principio è possibile misurare l’effetto di modificazioni delle variabili per tipologie di unità.
Lo stesso principio si utilizza per il calcolo dei valori previsti e dei residui: Il metodo di calcolo dei valori previsti e quindi dei residui Poiché il modello precede una “mistura” il metodo deve simultaneamente rendere conto della parte censurata (Ripartizione) e della parte ossservata: Naturalmente dipende dalla distribuzione ipotizzata a priori: Per residui normali è: In sostanza avremo un y=0 per coloro che date le x non superano la soglia stimata di censura
Esempio di stima: modello per le ore lavorate da un campione di donne (USA) Quester e Greene (1982) Obiettivo: verificare se le le donne il cui matrimonio sta per dissolversi, tendono a passare più o meno ore al lavoro
VariabileMLE stima Effetto Marginale Punto medio OLSOLS / % non censurati Figli piccoli Titolo studio Salario Secondo matrimonio Bassa prob. divorzio Alta prob. divorzio
Esempio 2: Acquisto di carne = f(reddito) Dati artificiali, censura artificiale
troncatacensurataOLS con zeri Ols "Vero"OLS solo Osservati Log L-257,1-173,8-206,3-198,9-116,4 AIC520,2353,6418,5403,8238,9 Intercept-115,1-72,954,313,7101,9 Se60,136,716,719,033,9 t-1,9-2,03,30,73,0 sig(t)0,05530,04680,00220,47650,0063 Reddito0,062360,060040,050370,053430,04675 Se0,005000,004520,002430,002770,00369 t12,513,320,719,312,7 sig(t)<,0001 _Sigma130,459153,92989,833102,377114,325
Esempio 2: Sportelli bancari = f(addetti) Dati effettivi, censura artificiale
Esempio 2: Sportelli bancari = f(addetti) Zoom sulla parte troncata/censurata
Zoom sulla censura
Eteroschedasticità Problema, in generale risolto sostituendo nella MLE Naturalmente è necessario specificare una “forma per l’eteroschedasticità Ad esempio: Non normalità stimatore robusto: LAD (Least Absolute Deviation) estimator Molto complesso Test di chester e Irish (1987) sui residui generalizzati Stima con dati panel = problema ancora aperto Problema principale sono i processi “double hurdle” con doppia decisione Sample selection models