La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Dipartimento di SEA Università degli Studi di Cagliari ___________________________ Elementi di econometria per gli studenti della specialistica EM ___________________________.

Presentazioni simili


Presentazione sul tema: "Dipartimento di SEA Università degli Studi di Cagliari ___________________________ Elementi di econometria per gli studenti della specialistica EM ___________________________."— Transcript della presentazione:

1 Dipartimento di SEA Università degli Studi di Cagliari ___________________________ Elementi di econometria per gli studenti della specialistica EM ___________________________ Prof. Paolo Mattana

2 Obiettivo importante: scoprire l'esistenza di relazioni tra le variabili Abbiamo già visto l'analisi di correlazione: solo relazioni lineari; solo intensità della relazione TEORIA DELLA REGRESSIONE

3 CHE COSE LECONOMETRIA? Definizione di Samuelson (1954): Leconometria può essere definita come lapplicazione della statistica matematica ai dati economici per ottenere il supporto empirico ai modelli costruiti nellambito della teoria economica e per ottenere stime numeriche. In pratica nasce dallintegrazione tra la teoria economica, leconomia matematica e la statistica allo scopo di: identificare valori numerici per i parametri delle relazioni economiche (elasticità, propensioni, valori marginali) verificare la validità delle teorie economiche proposte

4 Per confutare/confermare teorie economiche Per trovare veste numerica ai parametri Per metterci in grado di capire i lavori empirici Per metterci in grado di fare valutazioni autonome della realtà Per studiare relazioni esistenti fra comportamenti di soggetti economici (ad es. imprese) e risultati PERCHE STUDIARE LECONOMETRIA?

5 Individuazione di una asserzione teorica di interesse Creazione del modello matematico Specificazione della forma statistica Raccolta dati Stima Test delle ipotesi Uso del modello per scopi professionali/conoscitivi o di politica economica CENNI SUL METODO DELLECONOMETRIA

6 Es: da cosa dipende la domanda di benzina? Teoria economica: la domanda è influenzata: negativamente dal prezzo (P) positivamente dal reddito (R) dai rapporti di sostituibilità/complementarietà (G) dalle possibili innovazioni tecniche (T) Contesto multivariato: siamo interessati ai seguenti aspetti Effetti prodotti dalle variazioni di prezzo Effetti prodotti dalle altre variabili. INDIVIDUAZIONE DI UNASSERZIONE TEORICA

7 Altre forme più complesse? Leconomia matematica si incarica di dare veste funzionale alla relazione teorica di interesse Es. (nel caso di relazioni multivariate individuate dalla teoria) Lineare Log lineare CREAZIONE DI UN MODELLO MATEMATICO

8 La relazione matematica è esatta (mondo deterministico) Il mondo reale implica errori Non riusciamo a confortare la teoria con una relazione esatta. Esiste però la possibilità di considerare la relazione dal punto di vista statistico/econometrico SPECIFICAZIONE FORMA STATISTICA/ECONOMETRICA

9 Si aggiunga perciò un termine stocastico di errore Nella nuova formulazione, i parametri beta costituiscono loggetto dellanalisi; se i parametri sono diversi da zero trovo conferma alla teoria u è il termine stocastico di errore SPECIFICAZIONE FORMA STATISTICA/ECONOMETRICA

10 I dati possono avere la forma Cross-section Osservazioni relative ad una particolare unità economica (un consumatore, uno stato, un produttore) in un punto temporale. Come ci immaginiamo una cross-section? Es. di relazioni bivariate fra dati cross-section: PIL dei paesi UE / investimenti (anno 2000); Domanda Consumatori / reddito disponibile (1995); Etc…. RACCOLTA DATI

11 Serie temporali Abbiamo, in questo caso, osservazioni relative allevoluzione temporale della stessa unità economica (insieme di consumatori, stato, insieme di produttori …) Possono essere osservazioni annuali trimestrali mensili etc. Es. Pil italiano dal 1970 al 2007 (proviamo a scaricare le serie da istat.it RACCOLTA DATI

12 Analisi univariata Valutazione di medie, varianze, altri momenti….. Analisi bivariata Analisi di correlazione solo relazioni lineari solo intensità della relazione Analisi di regressione natura della relazione (es. causalità) forma della relazione (es. forma funzionale) relazioni non-lineari contesti multivariati STIMA – TIPI DI ANALISI

13 Le analisi forniscono risposte. Impareremo a valutare queste risposte con procedure ben precise (test delle ipotesi). Tali risposte possono Confermare la teoria Non confermare la teoria Dare indicazioni numeriche Nel caso in cui non si trovi conferma della teoria è sbagliata la teoria? la trasposizione empirica è viziata da qualche difetto? TEST DELLE IPOTESI - CONFRONTO CON I DATI

14 USO DEL MODELLO PER FINI PROFESSIONALI O … I modelli econometrici possono essere molto utili per fini professionali stima di funzioni di domanda e dei loro parametri stima di funzioni di costo e loro parametri per noi anche: relazione fra misure di concentrazione e profitti/occupazione relazione fra misure di diversificazione e profitti/occupazione relazione fra attività di innovazione e profitti/occupazione …. per avere indicazioni di politica economica stima di funzioni di consumo modello econometrico della Banca dItalia previsioni macroeconomiche …

15 Con l'analisi di regressione abbiamo la possibilità di studiare la natura della relazione fra le variabili e la forma che essa assume Prime limitazioni: Consideriamo solo due variabili (vedremo successivamente l'estensione al caso n-dimensionale); Il modello di regressione semplice prevede l'esistenza di una variabile endogena e di una variabile esogena; Inizieremo con modelli lineari. TEORIA DELLA REGRESSIONE

16 "immaginarci" la retta vera a partire dalle informazioni campionarie. Un metodo a mia disposizione è quello di "adattare" una retta alla nuvola di punti che rappresenta il mio campione e sperare di ottenere una stima (predizione) accettabile della retta vera. NB: Si parla di: disturbi quando si ragiona sulla retta vera errori o residui quando si ragiona sulla retta stimata Ricordiamoci sempre che la retta di regressione vera (quella della popolazione) è sconosciuta e tale resterà Obiettivo: TEORIA DELLA REGRESSIONE

17 Quale retta scelgo? Criterio di scelta deviazioni dalla media? modulo delle deviazioni dalla media? deviazioni al quadrato? Cosa implica la scelta del criterio? TEORIA DELLA REGRESSIONE

18

19

20 Un criterio logico per trovare una retta che attraversi una nuvola di punti è quello che "in qualche modo" imponga una riduzione degli scarti tra osservazioni e retta stimata (residui). NB: La retta vera è sconosciuta. Devo trovare un sostituto attendibile Criterio Minimizzare la somma degli scarti quadratici dalla retta (RSS ) METODO OLS (MINIMI QUADRATI ORDINARI

21 OLS sceglie alfa e beta in modo da minimizzare S = RSS Minimizzazione di una funzione rispetto a due variabili TEORIA DELLA REGRESSIONE

22 Primo elemento Secondo elemento TEORIA DELLA REGRESSIONE

23 Poichésono conosciuti, le uniche incognite sono Mettendo a sistema ottengo le stime OLS di Dove: è la media di Y TEORIA DELLA REGRESSIONE è la media di X

24 NB: TEORIA DELLA REGRESSIONE

25

26

27 Quindi posso scrivere: TEORIA DELLA REGRESSIONE

28 Condizioni del secondo ordine per il metodo OLS TEORIA DELLA REGRESSIONE

29 La regressione è significativa? Lequazione è stata ricavata da un campione e non dalla popolazione 1. Test t sullerrore standard della pendenza b: Ipotesi nulla = la pendenza è uguale a 0; 2. Analisi della varianza: si esamina il rapporto tra varianza spiegata dalla regressione e varianza residua. TEORIA DELLA REGRESSIONE

30 La t è una FDP che presenta una forma è schiacciata rispetto alla Z E stata calcolata dal matematico inglese Gosset (1908), che la pubblicò sotto lo pseudonimo di Student La sua forma esatta dipende dai gradi di libertà: GdL = n – parametri da stimare dove n è la dimensione del campione I valori della t sono tabulati (oppure si può usare la rete…) LINFERENZA STATISTICA

31 . Per campioni molto grandi, il valore di s oscilla poco intorno al suo valore medio. Quindi per valori molto grandi la distribuzione t si avvicina molto a quella di Z ed arriva a coincidere per infiniti gradi di libertà. Per piccoli campioni le differenze sono notevoli, data loscillazione casuale di s intorno a NB: In generale, la distribuzione t è rilevante ogniqualvolta si abbia: DISTRIBUZIONE t

32 etc …………… Parte della distribuzione che cade allesterno dei valori tabulati Valore critico di t per df=14 (con valore critico al 5%) Gradi di libertà DISTRIBUZIONE t

33 Principio base Residui grandi implicano un fit scadente Da questo principio posso costruire un indice di varianza spiegata In generale ho per tutte le osservazioni IL COEFFICIENTE DI DETERMINAZIONE

34

35 Questo darà vero anche se sommo tutte le osservazioni NB: La media può essere interpretata come il valore di Y i senza linfluenza dei regressori IL COEFFICIENTE DI DETERMINAZIONE

36 La relazione è valida anche per i quadrati In quanto IL COEFFICIENTE DI DETERMINAZIONE

37 Infatti Definizioni SST = Total Sum of Squares SSE = Explained Sum of Squares SSR = Residual Sum of Squares =0 =0 =0 IL COEFFICIENTE DI DETERMINAZIONE

38 Definizione: Il coefficiente di determinazione R 2 misura la quota parte della varianza della variabile dipendente spiegata dalla regressione. IL COEFFICIENTE DI DETERMINAZIONE

39 Finora: Abbiamo trovato uno stimatore per la relazione fra X e Y; Abbiamo sviluppato regole decisionali che permettono di usare lo stimatore per testare ipotesi sulla relazione tra X e Y; Ma abbiamo sempre preso in considerazione una sola X (ed un solo beta, coefficiente angolare) Il mondo è spesso più complicato!! Cosa succede se Y ha piu di una causa? IL MODELLO MULTIVARIATO

40 Lequazione da stimare diventa (in notazione scalare): dove le X j sono le variabili indipendenti (o regressori) e i beta sono parametri (sconosciuti) oggetto di stima. La logica OLS è la stessa NB: qual è ora linterpretazione dei beta? Possono essere visti come derivate parziali: misurano cioè leffetto sulla variabile dipendente di variazioni delle relative variabili indipendenti (ceteris paribus). IL MODELLO MULTIVARIATO

41 Ciascun elemento del vettore beta è una pendenza associata ad una X. Esattamente come in un contesto bivariato, tranne per il fatto che 1 (generico) rappresenta la variazione attesa di Y per una unità di incremento di X 1, (tenendo costanti X 2 …X n ); Quindi il coefficiente generico i rappresenta leffetto diretto di X i su Y (controllando per le diverse altre cause) IL MODELLO MULTIVARIATO

42 Svilupperemo ora il modello classico di regressione lineare Distingueremo le assunzioni sulla variabile indipendente e le assunzioni sui residui. Assunzioni sulla variabile indipendente IL MODELLO CLASSICO DI REGRESSIONE LINEARE

43 Assunzioni sui residui IIA: IIB IIC IID = costante IL MODELLO CLASSICO DI REGRESSIONE LINEARE

44 in media, la linea di regressione sia corretta X X1X1 X2X2 X3X3 Y IL MODELLO CLASSICO DI REGRESSIONE LINEARE

45 varianza costante dei disturbi (omoschedasticità) X Y X1X1 X2X2 X3X3 PDF di ε i IL MODELLO CLASSICO DI REGRESSIONE LINEARE

46 PDF di ε i X Y X1X1 X2X2 X3X3 IL MODELLO CLASSICO DI REGRESSIONE LINEARE varianza non costante dei disturbi (eteroschedasticità)

47 IL MODELLO CLASSICO DI REGRESSIONE LINEARE Lo scatter (X, Residui) spesso produce una nuvola a ventaglio Residui X

48 IIC Corr. NegativaCorr. PositivaAssenza Corr. IL MODELLO CLASSICO DI REGRESSIONE LINEARE

49 Residui t Esempio di correlazione seriale positiva nei residui

50 Le proprietà degli stimatori sono raggruppabili in due categorie: 1. Small sample properties; 2. Large sample properties Ricordiamo la definizione di stimatore? PROPRIETA DEGLI STIMATORI OLS

51 Correttezza Definizioni correlate Errore campionario: Abbiamo incontrato esempi di stimatori distorti. Ad es. tende a sottostimare bisogna correggere per n - 1 PROPRIETA DEGLI STIMATORI OLS

52 Correttezza: Uno stimatore corretto è centrato sul valore vero della popolazione PROPRIETA DEGLI STIMATORI OLS

53 Esempio di stimatore distorto PROPRIETA DEGLI STIMATORI OLS

54 EfficienzaVarianza minima Anche quando uno stimatore è non distorto esiste sempre la probabilità di avere una realizzazione campionaria molto lontana dalla media vera della popolazione. Tale probabilità sarà tanto più bassa quanto più lo stimatore è efficiente. N.B. La proprietà di efficienza è definita su uno stimatore rispetto a tutti gli altri. Lo stimatore corretto che presenta varianza minima è Best Unbiased Estimator PROPRIETA DEGLI STIMATORI OLS

55 A B Lo stimatore con distribuzione campionaria A non presenta varianza minima PROPRIETA DEGLI STIMATORI OLS

56 Esercizio 5.1 (Thomas) Una variabile casuale X ha media μ = 70 e varianza Per stimare μ estraiamo un campione casuale di dimensione n = 20 3 stimatori sono proposti: PROPRIETA DEGLI STIMATORI OLS

57 i.Dimostrare che a, b e c sono distorti ii.Calcolare la distorsione iii.Calcolare la varianza. Quale stimatore presenta var inferiore? i. PROPRIETA DEGLI STIMATORI OLS

58 (bias maggiore) ii. PROPRIETA DEGLI STIMATORI OLS Bias nel caso dello stimatore a: Bias nel caso dello stimatore b: Bias nel caso dello stimatore c:

59 iii. PROPRIETA DEGLI STIMATORI OLS

60 In quanto Proviamo ora a studiare le proprietà degli stimatori OLS quando le assunzioni del modello classico sono rispettate. Si parta dalla constatazione che: PROPRIETA DEGLI STIMATORI OLS

61 Possiamo anche scrivere dove è la parte deterministica PROPRIETA DEGLI STIMATORI OLS

62 Linearità Il modello che stiamo studiando è lineare in Y In quanto i termini sono costanti (X non è stocastica) Lo stesso si può dimostrare per lineare in Y PROPRIETA DEGLI STIMATORI OLS

63 Correttezza: lo stimatore OLS è corretto Punto di partenza PROPRIETA DEGLI STIMATORI OLS

64 Dalla forma: PROPRIETA DEGLI STIMATORI OLS

65 Uno stimatore è efficiente quando presenta la varianza minima tra tutti gli stimatori (ci si riferisce alla classe degli stimatori lineari ) Efficienza: lo stimatore OLS presenta varianza minima PROPRIETA DEGLI STIMATORI OLS Teorema di Gauss – Markov Per il modello di regressione lineare, sotto le assunzioni (IIA – IID), gli stimatori OLS hanno la varianza più piccola tra tutti gli stimatori lineari e corretti (unbiased). Lo stimatore OLS è BLUE.

66 La distribuzione campionaria degli stimatori OLS Quale sarà la distribuzione campionaria degli stimatori OLS? Sappiamo che: Ne deriva che: è la somma di una cost. e di una VC distribuita normalmente Quindi: PROPRIETA DEGLI STIMATORI OLS

67 Ora, poiché sono funzioni lineari di Y, ne deriviamo che, in infiniti campioni PROPRIETA DEGLI STIMATORI OLS

68 Come sono fatti e ? Per quanto riguardasappiamo che Da cui si ricava Standard error di PROPRIETA DEGLI STIMATORI OLS

69 Senza dimostrazione diamo anche: PROPRIETA DEGLI STIMATORI OLS

70 Nelle regressioni si usa il test – t di significatività statistica per verificare lesistenza di effetti lineari di una variabile indipendente sulla variabile dipendente è il coefficiente di regressione campionaria, SE( β j ) è lo standard error della distribuzione campionaria di β j PROPRIETA DEGLI STIMATORI OLS

71 Test su due code Test su una coda Come mai si usa la t e non la Z standardizzata? NB: La varianza della popolazione è sconosciuta; si approssima con la varianza (corretta) campionaria… PROPRIETA DEGLI STIMATORI OLS

72 La gran parte dei test (sia che usino il principio LR, Wald o LM) generano statistiche da semplici regressioni ausiliarie (OLS). Solo i test che usano il principio LR richiedono la stima di entrambi i modelli (ristretto e non ristretto). Wald richiede solo stima modello ristretto LM richiede solo stima modello non ristretto LA TRINITA DELLAPPROCCIO CLASSICO AL TEST

73 Basi di partenza: - Esistono alcuni risultati standard sulle proprietà distributive delle stime ottenute con metodi MLE - tali risultati possono utilizzarsi per costruire test asintotici (parametrici/non parametrici) - Il passaggio da MLE a OLS (lo stimatore che conosciamo) è semplice considerando che (sotto lipotesi di normalità degli residui), la funzione di verosimiglianza è proporzionale a RSS LA TRINITA DELLAPPROCCIO CLASSICO AL TEST

74 Lo stimatore MLE del vettore di parametri sarà: Sotto H 0 : MLE = arg MAX L( ) s.t. R = q Sotto H 1 : MLE = arg MAX L( ) Come selezionare un test desiderabile? Possiamo sfruttare 3 principi: LR, Wald e LM LA TRINITA DELLAPPROCCIO CLASSICO AL TEST

75 Le tre statistiche misurano la distanza secondo tre diversi criteri RELAZIONE FRA I TRE PRINCIPI

76 TEST JARQUE-BERA Statistica per testare lipotesi nulla di normalità dei residui. Sfrutta la differenza tra la statistica relativa ad una serie specifica e i valori che si dovrebbero determinare sotto una distribuzione normale. La statistica si computa come segue: dove S è lindice di simmetria, K il kurtosis e k il numero di coefficienti stimati. Sotto H0, JB si distribuisce come un χ2 con 2 gradi di libertà LA DIAGNOSTICA DI ROUTINE

77 TEST DI WHITE Statistica LM utile per testare la presenza di Eteroschedasticità di qualche forma (sconosciuta). Si parta dal modello generico e si studi la regressione ausiliaria: Test sullipotesi congiunta sotto H 0 LA DIAGNOSTICA DI ROUTINE

78 TEST DI WHITE La statistica si distribuisce come un χ2 con r (restrizioni) gradi di libertà. In Eviews esiste anche la versione semplificata senza cross- terms In presenza di Heteroschedasticità uso la stima GLS. In Eviews trovate le stime Heteroschedasticity-consistent LA DIAGNOSTICA DI ROUTINE

79 RESET TEST (REGRESSION SPECIFICATION ERROR TEST) RAMSEY Si prenda in considerazione il modello generale: Il RESET test ipotizza lesistenza di altre variabili (generiche) Se suppongo che la matrice Z sia composta di quadrati e altre potenze della Y avrò un test di corretta specificazione del modello LA DIAGNOSTICA DI ROUTINE

80 RESET TEST (REGRESSION SPECIFICATION ERROR TEST) RAMSEY Quindi il RESET è un test generale per i seguenti problemi: ·Omitted variables; X does not include all relevant variables. ·Incorrect functional form; some or all of the variables in Y and X should be transformed to logs, powers, reciprocals, or in some other way. ·Correlation between X and e, which may be caused by measurement error in X, simultaneous equation considerations, combination of lagged y values and serially correlated disturbances. LA DIAGNOSTICA DI ROUTINE

81 TEST BREUSCH-GODFREY (LM) DI CORRELAZIONE SERIALE - Test condotto con regressione ausiliaria; - Bisogna specificare lordine di correlazione (si fissa un numero sufficientemente elevato; - E valido anche in presenza di variabili dipendenti ritardate; LA DIAGNOSTICA DI ROUTINE

82 TEST BREUSCH-GODFREY (LM) DI CORRELAZIONE SERIALE Steps: - Si conduca la regressione - Si salvino i residui ; - Si conduca la regressione ausiliaria: - Il test è su unipotesi congiunta sui gamma… LA DIAGNOSTICA DI ROUTINE


Scaricare ppt "Dipartimento di SEA Università degli Studi di Cagliari ___________________________ Elementi di econometria per gli studenti della specialistica EM ___________________________."

Presentazioni simili


Annunci Google