Dipartimento di Economia Università degli Studi di Cagliari ___________________________ CORSO DI ECONOMETRIA Prof. Paolo Mattana Lez. 7 – Il modello multivariato
IL MODELLO MULTIVARIATO Finora: Abbiamo trovato uno stimatore per la relazione fra X e Y; Abbiamo sviluppato regole decisionali che permettono di usare lo stimatore per “testare” ipotesi sulla relazione tra X e Y; Ma abbiamo sempre preso in considerazione una sola X (ed un solo beta, coefficiente angolare) Il mondo è spesso più complicato!! Cosa succede se Y ha piu’ di una “causa”?
IL MODELLO MULTIVARIATO L’estensione al caso multivariato è semplice Invece di avere a che fare con lo spazio in due dimensioni dobbiamo considerare lo spazio multi-dimensionale Se abbiamo X1 e X2, allora stimiamo i parametri di un piano in mezzo ad una nuvola (di punti) tridimensionale. Oltre 3 dimensioni ….non possiamo visualizzare.
IL MODELLO MULTIVARIATO L’equazione da stimare diventa (in notazione scalare): dove le Xj sono le variabili indipendenti (o regressori) e i beta sono parametri (sconosciuti) oggetto di stima. La logica OLS è la stessa NB: qual è ora l’interpretazione dei beta? Possono essere visti come derivate parziali: misurano cioè l’effetto sulla variabile dipendente di variazioni delle relative variabili indipendenti (ceteris paribus).
IL MODELLO MULTIVARIATO NB: Dare le dimostrazioni delle proprietà degli stimatori OLS con questa notazione è inutilmente complicato. Passaggio alla notazione matriciale Possiamo rappresentare le derivazioni in termini di algebra lineare L’equazione generica da stimare diventa: dove X è un vettore i cui componenti valgono sempre uno.
IL MODELLO MULTIVARIATO In termini scalari abbiamo: NB: Stiamo post-moltiplicando perchè, per le proprietà delle matrici, solo così ri-otteniamo il modello in forma scalare
IL MODELLO MULTIVARIATO Ripassare: operazioni con le matrici; trasposizione di matrici inversione di matrici …in particolare
IL MODELLO MULTIVARIATO Matrice inversa Data una matrice quadrata A, , definiamo la matrice inversa B tale che AB = I (= matrice identità) L’inversa esiste solo se Una matrice invertibile è detta non-singolare Una matrice non invertibile è detta singolare
IL MODELLO MULTIVARIATO Una matrice importante: = SSR
IL MODELLO MULTIVARIATO Altra importante matrice: Come è fatta nel caso trivariato?
IL MODELLO MULTIVARIATO Problema dal punto di vista matematico nel contesto multivariato: Abbiamo bisogno di trovare il vettore dei beta che minimizza e’e=RSS Calcoliamo le derivate parziali rispetto ad ogni elemento di beta
IL MODELLO MULTIVARIATO Imponendo che le derivate siano uguali a 0 otteniamo Ovviamente generiamo k equazioni diverse (dove k è sconosciuto)
IL MODELLO MULTIVARIATO Otteniamo Dividiamo per esiste solo se non è singolare (ha rango pieno) Ciò significa che nessuna riga o colonna di X è una combinazione lineare di un’altra riga o colonna di X.
IL MODELLO MULTIVARIATO Ciascun elemento del vettore beta è una pendenza associata ad una X. Esattamente come in un contesto bivariato, tranne per il fatto che 1 (generico) rappresenta la variazione attesa di Y per una unità di incremento di X1, (tenendo costanti X2…Xn); Quindi il coefficiente generico i rappresenta l’effetto diretto di Xi su Y (controllando per le diverse altre cause)
IL MODELLO MULTIVARIATO Il coefficiente 1 è calcolato sulla base dell’area in giallo che si sovrappone a quella in blu, ma non a quella in rosso. L’area centrale non è presa in considerazione. Non sappiamo quale variabile la spieghi Problema (serio) della multicollinarità (studieremo bene) X1 Y X2
IL MODELLO MULTIVARIATO Tutto il discorso fatto per il modello bivariato si applica anche qui Bisogna aggiungere l’assenza di multicollinearità OLS è BLUE se:
IL MODELLO MULTIVARIATO NB: è una matrice Diversa da (Sum of squared errors) Gli elementi della diagonale principale sono le varianze di e1, e2,…en Gli elementi fuori diagonale sono le covarianze
IL MODELLO MULTIVARIATO Forma desiderabile della matrice varianza – covarianza dove I è la matrice identità
IL MODELLO MULTIVARIATO Violazione dell’assunzione Gli elementi sulla diagonale non sono costanti (Eteroschedasticità); Gli elementi fuori diagonale sono diversi da zero (Autocorrelazione) Abbiamo già visto (nel caso bivariato) che sono due distinti problemi che si manifestano con differenti tipi di dati
IL MODELLO MULTIVARIATO ETEROSCHEDASTICITA’ E’ un problema che si trova in dati cross-section (specialmente dati aggregati); L’accuratezza delle misurazioni può differire tra le unità prese in considerazione; L’errore può essere proporzionale alla grandezza dell’unità presa in considerazione (esempio PIL). COME E’ FATTA LA MATRICE VAR/COV DEGLI ERRORI?
IL MODELLO MULTIVARIATO AUTOCORRELAZIONE È un problema tipico delle serie temporali Può essere generato da errori di misura (autocorrelati) forma funzionale errata struttura dinamica COME E’ FATTA LA MATRICE VAR/COV DEGLI ERRORI?