Dipartimento di Economia Università degli Studi di Cagliari ___________________________ CORSO DI ECONOMETRIA Prof. Paolo Mattana Lezione n° 8 La violazione delle assunzioni classiche
VIOLAZIONI DELLE IPOTESI CLASSICHE Dobbiamo considerare: - la presenza di regressori stocastici e la multicollinearità - la violazione delle assunzioni classiche …….più tardi non stazionarietà
REGRESSORI STOCASTICI Abbiamo finora considerato il caso di regressori deterministici Tuttavia, abbiamo sempre sottolineato che questo caso non si attaglia ai dati econometrici Cosa succede alle proprietà degli stimatori quando prendiamo in considerazione regressori stocastici? Dobbiamo aggiungere l’assunzione di indipendenza fra residui e regressori NB: studieremo bene le implicazioni della violazione di questa particolare assunzione sui residui
REGRESSORI STOCASTICI Correttezza: lo stimatore OLS continua a essere corretto Partendo da:
REGRESSORI STOCASTICI Efficienza: lo stimatore OLS presenta varianza minima Consideriamo la seguente matrice simmetrica k x k:
REGRESSORI STOCASTICI Siccome :
REGRESSORI STOCASTICI Siccome:
REGRESSORI STOCASTICI Consistenza: lo stimatore OLS preserva le proprietà di consistenza PLIM Efficienza asintotica: lo stimatore OLS collassa più velocemente (tra tutti gli stimatori della sua classe) sul valore della popolazione (Non diamo le dimostrazioni)
MULTICOLLINARITÀ Sembrerebbe che la generalizzazione delle ipotesi classiche per tener conto di regressori stocastici non abbia fatto troppi danni. Tuttavia, come avremo modo di studiare nel dettaglio: L’ipotesi di indipendenza fra errori e variabili indipendenti è spesso violata nella realtà Dovremo studiare opportuni rimedi
MULTICOLLINARITÀ Nel caso di regressori stocastici, un problema che diventa rilevante è quello della multicollinarità Abbiamo già visto la multicollinarità (perfetta) quando le X sono linearmente legate l’una con l’altra. Cosa succede nel caso di regressori stocastici? NB: non è un problema di causalità, basta che le X siano correlate In questo caso, la multicollinarità non è PERFETTA: può essere calcolata e l’analisi può procedere
MULTICOLLINARITÀ Tuttavia, la multicollinarità può causare problemi A mano a mano che il grado di multicollinarità aumenta l’ammontare di informazione indipendente si riduce Il problema della multicollinarità, nel caso di regressori stocastici diventa l’insufficiente informazione campionaria
MULTICOLLINARITÀ Quando la correlazione tra le X è bassa, OLS ha molta informazione con cui procedere a stimare beta. Sono abbastanza sicuro del reale impatto delle due X su Y X1 Y X2
MULTICOLLINARITÀ Quando invece la correlazione fra le X è elevata, l’area di informazione indipendente si riduce. Ciò ci rende relativamente insicuri su quale sia il reale impatto delle due X su Y X1 Y X2
MULTICOLLINARITÀ Dal punto di vista matematico ciò dipende dal fatto che il Det di X’X tende a zero e quindi gli elementi della matrice diventano arbitrariamente grandi. In un contesto con 2 variabili indipendenti X, può dimostrarsi che: dove r è il coefficiente di correlazione campionaria fra le due X
MULTICOLLINARITÀ Pur essendo OLS è ancora BLUE deduciamo che la multicollinarità aumenta lo SE dei beta. NB: Ciò implica che i t-ratio tenderanno a essere bassi e a non farci rifiutare l’ipotesi nulla di non significatività dei regressori In conclusione, la multicollinità è un problema solo se porta al non Rifiuto dell’ipotesi nulla di non significatività statistica dei regressori
MULTICOLLINARITÀ SEGNI RIVELATORI La statistica F è significativa ma i singoli coefficienti no R2 molto elevato ma i singoli t-stat sono bassi; non esiste un particolare valore/soglia per sostenere che R-squared è troppo elevato. In linea generale, se R2 è più elevato di 0.9 e i beta non sono significativi c’è da preoccuparsi I coefficienti sono elevati ma statisticamente non significativi Gli SE dei beta cambiano ragguardevolmente quando altre variabili sono incluse o rimosse, ma non così i coefficienti
MULTICOLLINARITÀ DIAGNOSTICA Metodologia di Farrar/Glauber Regredire ciascuna X su tutte le altre e computare i coefficienti di determinazione (ausiliari); Se esiste una (quasi) relazione lineare, allora almeno un R-squared sarà molto elevato;
RESIDUI “NON SFERICI” Abbiamo già discusso il fatto che: esistono 2 motivi (principali) che possono portare a E(ee’) σ2I Gli elementi lungo la diagonale principale possono variare; Gli altri elementi possono non essere tutti zero.
RESIDUI “NON SFERICI” Il problema della non-constanza della varianza dell’errore è conosciuto come HETEROSKEDASTICITY Il problema delle covarianze non nulle degli errori è conosciuto come AUTOCORRELATION Sono problemi differenti che nascono in contesti diversi (dati di natura diversa) Le implicazioni per le proprietà degli stimatori OLS sono le stesse
RESIDUI “NON SFERICI” IMPLICAZIONI (uguali per heteroschedasticità e corr. seriale) DIAGNOSI (test diversi per ogni problema) EVENTUALI RIMEDI (trasformazioni GLS del modello)
RESIDUI “NON SFERICI” Le cause dell’eteroschedasticità E’ un problema che si trova in dati cross-section (specialmente dati aggregati); L’accuratezza delle misurazioni può differire tra le unità prese in considerazione; L’errore può essere proporzionale alla grandezza dell’unità presa in considerazione (esempio GDP). ….abbiamo già visualizzato nel modello bivariato
RESIDUI “NON SFERICI” Le cause dell’autocorrelazione. Nasce nelle time-series E’ possibile anche l’autocorrelazione nelle cross section. Si parla allora di correlazione “spaziale” che ha un significato preciso ed è difficile da trattare Errori di misurazione (autocorrelati) Struttura dinamica Forma funzionale errata (non genuina) ….abbiamo già visualizzato nel caso bivariato Proviamo a generare una serie artificiale autocorrelata
RESIDUI “NON SFERICI” Cosa succede se abbiamo una violazione delle assunzioni sul comportamento dei disturbi? NB: la matrice ee’ non si conforma alle ipotesi classiche Lo stimatore OLS: non è coinvolto e continua ad essere lineare - corretto - consistente
→ stiamo supponendo che la varianza dei disturbi non sia cost RESIDUI “NON SFERICI” La varianza e lo S.E. del coefficiente sono invece coinvolti. Si ricordi che avevamo dimostrato che: per cui, se: → stiamo supponendo che la varianza dei disturbi non sia cost - La formula per il calcolo dello SE di beta è ora sbagliata
RESIDUI “NON SFERICI” non possiamo utilizzare le procedure inferenziali viste fin qua; OLS non è più BLUE; Dobbiamo ricorrere alle procedure GLS che stimano (che è lo stimatore BLUE del vettore β vero della popolazione) Tuttavia V non è conosciuta. La si deve stimare: Abbiamo a che fare con Feasible Least Squares
RESIDUI “NON SFERICI” NB: Le stime GLS implicano una trasformazione del modello di regressione lineare. Ne studieremo diverse: Cochrane-Orcutt per il caso dell’autocorrelazione; WLS per il caso dell’eteroschedasticità.