Dipartimento di Economia

Slides:



Advertisements
Presentazioni simili
Tecniche di analisi dei dati e impostazione dell’attività sperimentale
Advertisements

Statistica Economica I
I TEST DI SIGNIFICATIVITA' IL TEST DI STUDENT
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Dipartimento di Economia
Dipartimento di Economia
Distribuzione Normale o Curva di Gauss
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Confronto tra 2 campioni Nella pratica è utilissimo confrontare se 2 campioni provengono da popolazioni con la stessa media: Confronti tra produzioni di.
TESTI UTILI PER PAPER/TESI 1
Analisi dei dati per i disegni ad un fattore
La regressione lineare trivariata
Dipartimento di SEA Università degli Studi di Cagliari
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 10.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
IL MODELLO DI REGRESSIONE MULTIPLA
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
MODELLO DI REGRESSIONE LINEARE MULTIPLA
Dip. Economia Politica e Statistica
Analisi della varianza (a una via)
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Sistemi di equazioni lineari
Corso di biomatematica lezione 10: test di Student e test F
STATISTICA a.a PARAMETRO t DI STUDENT
Valutazione della stima: gli intervalli di confidenza
1 Y Modello di regressione semplice Supponiamo che una variabile Y sia funzione lineare di unaltra variabile X, con parametri incogniti 1 e 2 che vogliamo.
Propagazione degli errori
“Analisi delle serie storiche e applicazioni”
Statistica economica (6 CFU)
Statistica economica (6 CFU) Corso di Laurea in Economia e Commercio a.a Docente: Lucia Buzzigoli Lezione 5 1.
Statistica economica (6 CFU)
STATISTICA PER LE DECISIONI DI MARKETING
STATISTICA PER LE DECISIONI DI MARKETING
LABORATORIO DI ANALISI AVANZATA DEI DATI Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LINEARE MULTIPLA Esempio (d)istruttivo.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
L’analisi di regressione lineare ed i passaggi logici
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9 Regressione lineare multipla: la stima del modello e la sua valutazione, metodi automatici.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Didattica e Fondamenti degli Algoritmi e della Calcolabilità Terza giornata: principali classi di complessità computazionale dei problemi Guido Proietti.
Strumenti statistici in Excell
IL CAMPIONE.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°10 Regressione lineare multipla: la valutazione del modello, metodi automatici di selezione.
Riassumendo: ipotesi per OLS 1.Modello lineare 2.X e Y sono frutto di osservazioni indipendenti 3.X è di rango pieno 4.I residui hanno media = 0 5.I residui.
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Analisi discriminante lineare - contesto
Def : uno stimatore è una statistica T n le cui determinazioni servono a fornire delle stime del parametro ignoto  della v.c. X in cui sono state effettuate.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
La covarianza.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
Statistica per l’economia e l’impresa Capitolo 4 MODELLO DI REGRESSIONE LINEARE SEMPLICE.
MODELLO DI REGRESSIONE LINEARE MULTIPLA
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Autocorrelazione dei residui
Transcript della presentazione:

Dipartimento di Economia Università degli Studi di Cagliari ___________________________ CORSO DI ECONOMETRIA Prof. Paolo Mattana Lezione n° 8 La violazione delle assunzioni classiche

VIOLAZIONI DELLE IPOTESI CLASSICHE Dobbiamo considerare: - la presenza di regressori stocastici e la multicollinearità - la violazione delle assunzioni classiche …….più tardi non stazionarietà

REGRESSORI STOCASTICI Abbiamo finora considerato il caso di regressori deterministici Tuttavia, abbiamo sempre sottolineato che questo caso non si attaglia ai dati econometrici Cosa succede alle proprietà degli stimatori quando prendiamo in considerazione regressori stocastici? Dobbiamo aggiungere l’assunzione di indipendenza fra residui e regressori NB: studieremo bene le implicazioni della violazione di questa particolare assunzione sui residui

REGRESSORI STOCASTICI Correttezza: lo stimatore OLS continua a essere corretto Partendo da:

REGRESSORI STOCASTICI Efficienza: lo stimatore OLS presenta varianza minima Consideriamo la seguente matrice simmetrica k x k:

REGRESSORI STOCASTICI Siccome :

REGRESSORI STOCASTICI Siccome:

REGRESSORI STOCASTICI Consistenza: lo stimatore OLS preserva le proprietà di consistenza PLIM Efficienza asintotica: lo stimatore OLS collassa più velocemente (tra tutti gli stimatori della sua classe) sul valore della popolazione (Non diamo le dimostrazioni)

MULTICOLLINARITÀ Sembrerebbe che la generalizzazione delle ipotesi classiche per tener conto di regressori stocastici non abbia fatto troppi danni. Tuttavia, come avremo modo di studiare nel dettaglio: L’ipotesi di indipendenza fra errori e variabili indipendenti è spesso violata nella realtà Dovremo studiare opportuni rimedi

MULTICOLLINARITÀ Nel caso di regressori stocastici, un problema che diventa rilevante è quello della multicollinarità Abbiamo già visto la multicollinarità (perfetta) quando le X sono linearmente legate l’una con l’altra. Cosa succede nel caso di regressori stocastici? NB: non è un problema di causalità, basta che le X siano correlate In questo caso, la multicollinarità non è PERFETTA: può essere calcolata e l’analisi può procedere

MULTICOLLINARITÀ Tuttavia, la multicollinarità può causare problemi A mano a mano che il grado di multicollinarità aumenta l’ammontare di informazione indipendente si riduce Il problema della multicollinarità, nel caso di regressori stocastici diventa l’insufficiente informazione campionaria

MULTICOLLINARITÀ Quando la correlazione tra le X è bassa, OLS ha molta informazione con cui procedere a stimare beta. Sono abbastanza sicuro del reale impatto delle due X su Y X1 Y X2

MULTICOLLINARITÀ Quando invece la correlazione fra le X è elevata, l’area di informazione indipendente si riduce. Ciò ci rende relativamente insicuri su quale sia il reale impatto delle due X su Y X1 Y X2

MULTICOLLINARITÀ Dal punto di vista matematico ciò dipende dal fatto che il Det di X’X tende a zero e quindi gli elementi della matrice diventano arbitrariamente grandi. In un contesto con 2 variabili indipendenti X, può dimostrarsi che: dove r è il coefficiente di correlazione campionaria fra le due X

MULTICOLLINARITÀ Pur essendo OLS è ancora BLUE deduciamo che la multicollinarità aumenta lo SE dei beta. NB: Ciò implica che i t-ratio tenderanno a essere bassi e a non farci rifiutare l’ipotesi nulla di non significatività dei regressori In conclusione, la multicollinità è un problema solo se porta al non Rifiuto dell’ipotesi nulla di non significatività statistica dei regressori

MULTICOLLINARITÀ SEGNI RIVELATORI La statistica F è significativa ma i singoli coefficienti no R2 molto elevato ma i singoli t-stat sono bassi; non esiste un particolare valore/soglia per sostenere che R-squared è troppo elevato. In linea generale, se R2 è più elevato di 0.9 e i beta non sono significativi c’è da preoccuparsi I coefficienti sono elevati ma statisticamente non significativi Gli SE dei beta cambiano ragguardevolmente quando altre variabili sono incluse o rimosse, ma non così i coefficienti

MULTICOLLINARITÀ DIAGNOSTICA Metodologia di Farrar/Glauber Regredire ciascuna X su tutte le altre e computare i coefficienti di determinazione (ausiliari); Se esiste una (quasi) relazione lineare, allora almeno un R-squared sarà molto elevato;

RESIDUI “NON SFERICI” Abbiamo già discusso il fatto che: esistono 2 motivi (principali) che possono portare a E(ee’)  σ2I Gli elementi lungo la diagonale principale possono variare; Gli altri elementi possono non essere tutti zero.

RESIDUI “NON SFERICI” Il problema della non-constanza della varianza dell’errore è conosciuto come HETEROSKEDASTICITY Il problema delle covarianze non nulle degli errori è conosciuto come AUTOCORRELATION Sono problemi differenti che nascono in contesti diversi (dati di natura diversa) Le implicazioni per le proprietà degli stimatori OLS sono le stesse

RESIDUI “NON SFERICI” IMPLICAZIONI (uguali per heteroschedasticità e corr. seriale) DIAGNOSI (test diversi per ogni problema) EVENTUALI RIMEDI (trasformazioni GLS del modello)

RESIDUI “NON SFERICI” Le cause dell’eteroschedasticità E’ un problema che si trova in dati cross-section (specialmente dati aggregati); L’accuratezza delle misurazioni può differire tra le unità prese in considerazione; L’errore può essere proporzionale alla grandezza dell’unità presa in considerazione (esempio GDP). ….abbiamo già visualizzato nel modello bivariato

RESIDUI “NON SFERICI” Le cause dell’autocorrelazione. Nasce nelle time-series E’ possibile anche l’autocorrelazione nelle cross section. Si parla allora di correlazione “spaziale” che ha un significato preciso ed è difficile da trattare Errori di misurazione (autocorrelati) Struttura dinamica Forma funzionale errata (non genuina) ….abbiamo già visualizzato nel caso bivariato Proviamo a generare una serie artificiale autocorrelata

RESIDUI “NON SFERICI” Cosa succede se abbiamo una violazione delle assunzioni sul comportamento dei disturbi? NB: la matrice ee’ non si conforma alle ipotesi classiche Lo stimatore OLS: non è coinvolto e continua ad essere lineare - corretto - consistente

→ stiamo supponendo che la varianza dei disturbi non sia cost RESIDUI “NON SFERICI” La varianza e lo S.E. del coefficiente sono invece coinvolti. Si ricordi che avevamo dimostrato che: per cui, se: → stiamo supponendo che la varianza dei disturbi non sia cost - La formula per il calcolo dello SE di beta è ora sbagliata

RESIDUI “NON SFERICI” non possiamo utilizzare le procedure inferenziali viste fin qua; OLS non è più BLUE; Dobbiamo ricorrere alle procedure GLS che stimano (che è lo stimatore BLUE del vettore β vero della popolazione) Tuttavia V non è conosciuta. La si deve stimare: Abbiamo a che fare con Feasible Least Squares

RESIDUI “NON SFERICI” NB: Le stime GLS implicano una trasformazione del modello di regressione lineare. Ne studieremo diverse: Cochrane-Orcutt per il caso dell’autocorrelazione; WLS per il caso dell’eteroschedasticità.